ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

특허 검색
구분 출원국
출원년도 ~ 키워드

상세정보

등록 문장 경계 인식 장치 및 방법

문장 경계 인식 장치 및 방법
이미지 확대
발명자
황금하, 김영길
출원번호
10-2015-0063994 (2015.05.07) KIPRIS
공개번호
10-2016-0131501 (2016.11.16)
등록번호
10-2498839-0000 (2023.02.07)
출원국
대한민국
협약과제
14MS5500, 지식학습 기반의 다국어 확장이 용이한 관광/국제행사 통역률 90%급 자동 통번역 소프트웨어 원천 기술 개발, 김영길
초록
본 발명은 문장 경계 표시가 없는 텍스트에 대한 문장 경계를 인식하기 위한 장치 및 방법 에 관한 것이다. 이를 위한 본 발명의 문장 경계 인식 방법은 입력 텍스트의 엔그램(n-gram) 정보를 포함하는 특징 정보를 추출하는 단계; 문장 경계 정보를 포함하는 학습 코퍼스를 근거로, 문장 경계 임시 후보들에 대한 후보 확률들을 추출하는 단계; 후보 확률들을 근거로 문장 경계 임시 후보들에 대한 후보 점수들을 산출하는 단계; 후보 점수가 기설정된 임계 점수 이상인 문장 경계 임시 후보들을 문장 경계 후보들로 선택하는 단계; 및 문장 경계 후보들의 엔그램 정보를 포함하는 특징 정보와 후보 점수 정보를 사용하여 문장 경계 여부를 최종 분류하는 단계를 포함하는 것을 특징으로 한다.
KSP 제안 키워드
n-Gram