Registered
APPARATUS AND METHOD FOR ADDING NEW PROPER NOUNS TO LANGUAGE MODEL IN A CONTINUOUS SPEECH RECOGNITION SYSTEM
- Inventors
-
Wang Ji Hyun, Sanghun Kim, Kim Jeong Se, Yun Seung, Park Sang Kyu, Soo-Jong Lee
- Application No.
-
10-2011-0079586 (2011.08.10)
KIPRIS
- Publication No.
-
10-2013-0017260 (2013.02.20)
- Registration No.
- 10-1388569-0000 (2014.04.17)
- Country
- KOREA
- Project Code
-
11MS2100, Development of Portable Korean-English Automatic Speech Translation Technology,
Sanghun Kim
- Abstract
- 본 발명은 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 기술에 관한 것으로, 신규 고유명사와 분류어를 수집하고, 수집된 단어들을 이용하여 텍스트 코퍼스로부터 후보 문장을 선정하며, 후보 문장으로부터 후보 문틀을 추출하고, 후보 문틀의 엔그램을 생성한 후, 각 후보 문틀을 통계적인 계산식을 이용하여 점수화 및 순위화를 수행하고, 상위의 문틀을 고유명사에 적용한 후 엔그램을 확장하여 언어모델에 반영하는 것을 특징으로 한다. 본 발명에 의하면, 음성인식을 위한 언어모델에 없는 신규 고유명사를 문장의 다양한 표현을 반영한 엔그램 형태로 추가할 수 있기 때문에 단순히 고유명사 만으로 추가하는 방법보다 고유 명사의 높은 음성인식 성능을 얻을 수 있다.
- KSP Keywords
- Continuous Speech, Continuous Speech Recognition, Language model, Recognition System, Speech recognition system, speech recognition