ETRI-Knowledge Sharing Plaform

KOREAN
특허 검색
Status Country
Year ~ Keyword

Detail

Registered Method for restoring Korean omitted components based on language model

언어모델에 기반한 한국어 생략 성분 복원 방법
이미지 확대
Inventors
Soojong Lim, Hyunki Kim, Hyung Jik Lee, Heo Jeong, Jang Myung Gil, Kyungman Bae, Wang Ji Hyun, Miran Choi, Minho Kim, Ryu Jihee, Yongjin Bae, Lim Joon-Ho
Application No.
10-2017-0164239 (2017.12.01) KIPRIS
Publication No.
10-2019-0064910 (2019.06.11)
Registration No.
10-2157390-0000 (2020.09.11)
Country
KOREA
Project Code
17HS3800, Development of Knowledge Evolutionary WiseQA Platform Technology for Knowledge Augmented Services, Hyunki Kim
Abstract
본 발명은 언어모델에 기반한 한국어 생략 성분 복원 방법에 관한 것으로, 문장을 입력받는 입력 단계; 입력된 문장에 대한 구문을 분석하는 분석 단계; 구문 분석을 통해 생략된 단어가 존재하는지 판단하는 판단 단계; 판단 단계에서 생략된 단어가 존재하면, 이전 구문 중 생략된 단어가 없는 문장의 어구를 대상으로 문장 내에서 복원 후보 단어를 추출하는 추출 단계; 생략된 성분이 존재하는 성분들을 이용하여 구성 가능한 복원 후보 문장들을 생성하는 언어모델 적용 단계; 및 생성된 각 복원 후보 문장에 대한 구성 확률 값을 산출하고, 산출된 구성 확률 값을 이용하여 복원 후보 문장을 선택하는 생략 대상 결정 단계;를 포함한다.
KSP Keywords
Language model