ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

특허 검색
구분 출원국
출원년도 ~ 키워드

상세정보

등록 음성 인식을 위한 음향 모델 학습 장치 및 그 학습 방법

음성 인식을 위한 음향 모델 학습 장치 및 그 학습 방법
이미지 확대
발명자
강병옥, 이윤근, 박전규
출원번호
10-2018-0143612 (2018.11.20) KIPRIS
공개번호
10-2020-0063315 (2020.06.05)
등록번호
10-2418887-0000 (2022.07.05)
출원국
대한민국
협약과제
17HS5700, 언어학습을 위한 자유발화형 음성대화처리 원천기술 개발, 이윤근
초록
본 발명의 음성 인식을 위한 음향 모델 학습 방법은, N개의 출력 노드에 의해 N개의 상태들을 갖도록 구성된 심층 신경망 기반의 대형 음향 모델과 미전사된(Untranscribed) 대량 음성 데이터를 입력으로 이용하여, M(M 003c# N)개의 출력 노드에 의해 M개의 상태들을 갖도록 구성된 심층 신경망 기반의 소형 음향 모델을 대상으로 비교사 학습(Unsupervised learning)을 수행하고, 사용자 환경과 매칭되는 전사된(transcribed) 소량 음성 데이터를 입력으로 이용하여, 상기 비교사 학습에 의해 학습된 소형 음향 모델을 대상으로 교사 학습(Supervised learning)을 수행하여, 미세 조정된 심층 신경망 기반의 최종 음향 모델을 생성한다.
KSP 제안 키워드
Learning methods, Model learning, Supervised Learning, acoustic model, speech recognition, unsupervised learning