ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

특허 검색
구분 출원국
출원년도 ~ 키워드

상세정보

등록 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 장치 및 방법

연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 장치 및 방법
이미지 확대
발명자
왕지현, 김상훈, 윤승, 김정세, 이수종, 박상규
출원번호
10-2011-0079586 (2011.08.10) KIPRIS
공개번호
10-2013-0017260 (2013.02.20)
등록번호
10-1388569-0000 (2014.04.17)
출원국
대한민국
협약과제
11MS2100, 휴대형 한/영 자동통역 기술개발, 김상훈
초록
본 발명은 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 기술에 관한 것으로, 신규 고유명사와 분류어를 수집하고, 수집된 단어들을 이용하여 텍스트 코퍼스로부터 후보 문장을 선정하며, 후보 문장으로부터 후보 문틀을 추출하고, 후보 문틀의 엔그램을 생성한 후, 각 후보 문틀을 통계적인 계산식을 이용하여 점수화 및 순위화를 수행하고, 상위의 문틀을 고유명사에 적용한 후 엔그램을 확장하여 언어모델에 반영하는 것을 특징으로 한다. 본 발명에 의하면, 음성인식을 위한 언어모델에 없는 신규 고유명사를 문장의 다양한 표현을 반영한 엔그램 형태로 추가할 수 있기 때문에 단순히 고유명사 만으로 추가하는 방법보다 고유 명사의 높은 음성인식 성능을 얻을 수 있다.
KSP 제안 키워드
Continuous Speech, Continuous Speech Recognition, Language model, Recognition System, Speech recognition system, speech recognition