Registered
Method for restoring Korean omitted components based on language model
- Inventors
-
Soojong Lim, Hyunki Kim, Hyung Jik Lee, Heo Jeong, Jang Myung Gil, Kyungman Bae, Wang Ji Hyun, Miran Choi, Minho Kim, Ryu Jihee, Yongjin Bae, Lim Joon-Ho
- Application No.
-
10-2017-0164239 (2017.12.01)
KIPRIS
- Publication No.
-
10-2019-0064910 (2019.06.11)
- Registration No.
- 10-2157390-0000 (2020.09.11)
- Country
- KOREA
- Project Code
-
17HS3800, Development of Knowledge Evolutionary WiseQA Platform Technology for Knowledge Augmented Services,
Hyunki Kim
- Abstract
- 본 발명은 언어모델에 기반한 한국어 생략 성분 복원 방법에 관한 것으로, 문장을 입력받는 입력 단계; 입력된 문장에 대한 구문을 분석하는 분석 단계; 구문 분석을 통해 생략된 단어가 존재하는지 판단하는 판단 단계; 판단 단계에서 생략된 단어가 존재하면, 이전 구문 중 생략된 단어가 없는 문장의 어구를 대상으로 문장 내에서 복원 후보 단어를 추출하는 추출 단계; 생략된 성분이 존재하는 성분들을 이용하여 구성 가능한 복원 후보 문장들을 생성하는 언어모델 적용 단계; 및 생성된 각 복원 후보 문장에 대한 구성 확률 값을 산출하고, 산출된 구성 확률 값을 이용하여 복원 후보 문장을 선택하는 생략 대상 결정 단계;를 포함한다.
- KSP Keywords
- Language model