ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

특허 검색
구분 출원국
출원년도 ~ 키워드

상세정보

등록 언어모델에 기반한 한국어 생략 성분 복원 방법

언어모델에 기반한 한국어 생략 성분 복원 방법
이미지 확대
발명자
임수종, 김현기, 왕지현, 배용진, 허정, 임준호, 김민호, 배경만, 류지희, 최미란, 장명길, 이형직
출원번호
10-2017-0164239 (2017.12.01) KIPRIS
공개번호
10-2019-0064910 (2019.06.11)
등록번호
10-2157390-0000 (2020.09.11)
출원국
대한민국
협약과제
17HS3800, (엑소브레인-1세부) 휴먼 지식증강 서비스를 위한 지능진화형 WiseQA 플랫폼 기술 개발, 김현기
초록
본 발명은 언어모델에 기반한 한국어 생략 성분 복원 방법에 관한 것으로, 문장을 입력받는 입력 단계; 입력된 문장에 대한 구문을 분석하는 분석 단계; 구문 분석을 통해 생략된 단어가 존재하는지 판단하는 판단 단계; 판단 단계에서 생략된 단어가 존재하면, 이전 구문 중 생략된 단어가 없는 문장의 어구를 대상으로 문장 내에서 복원 후보 단어를 추출하는 추출 단계; 생략된 성분이 존재하는 성분들을 이용하여 구성 가능한 복원 후보 문장들을 생성하는 언어모델 적용 단계; 및 생성된 각 복원 후보 문장에 대한 구성 확률 값을 산출하고, 산출된 구성 확률 값을 이용하여 복원 후보 문장을 선택하는 생략 대상 결정 단계;를 포함한다.
KSP 제안 키워드
Language model