등록
언어모델에 기반한 한국어 생략 성분 복원 방법
- 발명자
-
임수종, 김현기, 왕지현, 배용진, 허정, 임준호, 김민호, 배경만, 류지희, 최미란, 장명길, 이형직
- 출원번호
-
10-2017-0164239 (2017.12.01)
KIPRIS
- 공개번호
-
10-2019-0064910 (2019.06.11)
- 등록번호
- 10-2157390-0000 (2020.09.11)
- 출원국
- 대한민국
- 협약과제
-
17HS3800, (엑소브레인-1세부) 휴먼 지식증강 서비스를 위한 지능진화형 WiseQA 플랫폼 기술 개발,
김현기
- 초록
- 본 발명은 언어모델에 기반한 한국어 생략 성분 복원 방법에 관한 것으로, 문장을 입력받는 입력 단계; 입력된 문장에 대한 구문을 분석하는 분석 단계; 구문 분석을 통해 생략된 단어가 존재하는지 판단하는 판단 단계; 판단 단계에서 생략된 단어가 존재하면, 이전 구문 중 생략된 단어가 없는 문장의 어구를 대상으로 문장 내에서 복원 후보 단어를 추출하는 추출 단계; 생략된 성분이 존재하는 성분들을 이용하여 구성 가능한 복원 후보 문장들을 생성하는 언어모델 적용 단계; 및 생성된 각 복원 후보 문장에 대한 구성 확률 값을 산출하고, 산출된 구성 확률 값을 이용하여 복원 후보 문장을 선택하는 생략 대상 결정 단계;를 포함한다.
- KSP 제안 키워드
- Language model