ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

특허 검색
구분 출원국
출원년도 ~ 키워드

상세정보

등록 문서정보 학습기반 통계적 HMM 품사 태깅 장치 및 그 방법

문서정보 학습기반 통계적 HMM 품사 태깅 장치 및 그 방법
이미지 확대
발명자
권오욱, 최승권, 김영길, 서영애, 노윤형, 양성일, 박은진, 김창현, 윤창호, 오영순, 김운, 황금하, 박상규, 이기영
출원번호
10-2009-0075778 (2009.08.17) KIPRIS
공개번호
10-2011-0018140 (2011.02.23)
등록번호
10-1250900-0000 (2013.03.29)
출원국
대한민국
협약과제
09MS5200, 한중영 대화체 및 기업문서 자동번역 기술개발, 김영길
초록
본 발명은 문서정보 학습기반 통계적 HMM 품사 태깅 장치 및 그 방법에 관한 것으로, 입력되는 문서에 따라 달라지는 문맥 확률, 어휘 확률과 태깅 오류 수정 규칙을 실시간으로 추출하여 품사 태깅하고자 하는 입력 문서의 장르와 도메인에 의존적인 확률 정보와 수정 규칙 등을 추출할 수 있다. 또한, 본 발명은 기학습된 코퍼스에서 나타나지 않는 다양한 장르나 도메인의 문서에 대해서도 실시간으로 입력 문서에서 학습된 정보를 사용함으로써, 다양한 장르나 도메인의 문서에 대한 태깅 정확성을 높일 수 있으며, 문서에 대한 언어적 분석을 필요로 하는 자동번역 및 정보검색 등의 시스템에서 언어분석 정확도를 향상시켜 전체 번역 성능 및 정확성을 향상시킬 수 있다.