ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

특허 검색
구분 출원국
출원년도 ~ 키워드

상세정보

등록 다중 음향공간 GMM을 이용한 음향모델 생성 방법

다중 음향공간 GMM을 이용한 음향모델 생성 방법
이미지 확대
발명자
강병옥, 이성주, 송화전, 이윤근, 정호영
출원번호
10-2013-0119607 (2013.10.08) KIPRIS
공개번호
10-2015-0041289 (2015.04.16)
등록번호
10-1892095-0000 (2018.08.21)
출원국
대한민국
협약과제
13VS1500, 모바일 플랫폼 기반 대화모델 적용 자연어 음성인터페이스 기술 개발, 이윤근
초록
다중 음향공간 GMM을 이용한 음향모델 생성 방법이 개시된다. 본 발명에 따른 다중 음향공간 GMM을 이용한 음향모델 생성 방법은 소량의 음성 데이터베이스를 수집하는 단계; 상기 음성 데이터베이스를 이용하여 n개의 기존 음향모델들에서 통계정보를 산출하는 단계; 상기 산출한 통계정보 및 상기 n개의 기존 음향모델들의 통합규칙(tying rule)을 기초로 하여 최적 모델단위를 결정하는 단계; 상기 n개의 기존 음향모델들을 1 가우시안 혼합 모델(1 Gaussian mixture model)과 각각 혼합하여 가우시안 혼합 수를 증가시킨 n개의 n 가우시안 혼합 모델들을 생성하는 단계; 상기 최적 모델단위를 상기 n개의 n 가우시안 혼합 모델들을 결합한 결과에 적용하여 최종 가우시안 혼합 모델을 생성하는 단계; 및 상기 최종 가우시안 혼합 모델을 각 모델단위로 구성하는 최종 음향모델의 변별학습 결과를 기초로 하여 상기 최종 가우시안 혼합 모델 간의 최적 가중치를 계산하는 단계를 포함한다.