ETRI-Knowledge Sharing Plaform

KOREAN
특허 검색
Status Country
Year ~ Keyword

Detail

Registered APPARATUS AND METHOD FOR ADDING NEW PROPER NOUNS TO LANGUAGE MODEL IN A CONTINUOUS SPEECH RECOGNITION SYSTEM

연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 장치 및 방법
이미지 확대
Inventors
Wang Ji Hyun, Sanghun Kim, Kim Jeong Se, Yun Seung, Park Sang Kyu, Soo-Jong Lee
Application No.
10-2011-0079586 (2011.08.10) KIPRIS
Publication No.
10-2013-0017260 (2013.02.20)
Registration No.
10-1388569-0000 (2014.04.17)
Country
KOREA
Project Code
11MS2100, Development of Portable Korean-English Automatic Speech Translation Technology, Sanghun Kim
Abstract
본 발명은 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 기술에 관한 것으로, 신규 고유명사와 분류어를 수집하고, 수집된 단어들을 이용하여 텍스트 코퍼스로부터 후보 문장을 선정하며, 후보 문장으로부터 후보 문틀을 추출하고, 후보 문틀의 엔그램을 생성한 후, 각 후보 문틀을 통계적인 계산식을 이용하여 점수화 및 순위화를 수행하고, 상위의 문틀을 고유명사에 적용한 후 엔그램을 확장하여 언어모델에 반영하는 것을 특징으로 한다. 본 발명에 의하면, 음성인식을 위한 언어모델에 없는 신규 고유명사를 문장의 다양한 표현을 반영한 엔그램 형태로 추가할 수 있기 때문에 단순히 고유명사 만으로 추가하는 방법보다 고유 명사의 높은 음성인식 성능을 얻을 수 있다.
KSP Keywords
Continuous Speech, Continuous Speech Recognition, Language model, Recognition System, Speech recognition system, speech recognition