Registered
태깅된 도메인 코퍼스 없이 새로운 도메인에 적용 가능한 통계적 HMM 품사 태깅 장치 및 방법
- Inventors
-
Kwon Oh Woog, Yang Seong Il, Lee Ki Young, Kim Young Kil, Young-Ae Seo, Roh Yoon-Hyung, Choi Sung Kwon, Ryu Cheol, Hong Munpyo, Park Sang Kyu, Kim Chang Hyun
- Application No.
-
10-2006-0056201 (2006.06.22)
KIPRIS
- Publication No.
-
10-2007-0061182 (2007.06.13)
- Registration No.
- 10-0784730-0000 (2007.12.05)
- Country
- KOREA
- Project Code
-
05MF1100, Language Information Processing Technology Development,
Young Jik Lee
- Abstract
- 본 발명은 통계적 HMM(Hidden Markov Model) 품사 태깅 장치 및 방법에 관한 것으로, 적용 도메인에 따라 어휘확률이 달라지는 어휘를 선출하여 그 어휘의 어휘확률을 적용 도메인에 맞추어 갱신함으로써, 많은 비용과 시간이 드는 적용 도메인의 태깅된 코퍼스 없이, 다양한 도메인에서 높은 성능으로 적용할 수 있는 것을 특징으로 한다. 본 발명에 따르면, 새로운 특정 도메인에서 정확도가 떨어지는 기존의 통계적 품사 태깅 방법에 비하여, 품사 태깅의 정확성을 크게 향상시킬 수 있으며, 손쉽게 획득할 수 있는 다양한 도메인의 원시 코퍼스(raw corpus)들을 기반으로 각 도메인 의존 어휘확률만을 새로이 재학습하여 갱신함으로써, 태깅된 도메인 코퍼스 없이 특정 도메인에서의 태깅 정확성을 높일 뿐만 아니라 다양한 도메인에서 높은 정확도의 통계적 품사 태깅을 수행할 수 있는 효과가 있다.