등록
음성 인식을 위한 음향 모델 학습 장치 및 그 학습 방법
- 발명자
-
강병옥, 이윤근, 박전규
- 출원번호
-
10-2018-0143612 (2018.11.20)
KIPRIS
- 공개번호
-
10-2020-0063315 (2020.06.05)
- 등록번호
- 10-2418887-0000 (2022.07.05)
- 출원국
- 대한민국
- 협약과제
-
17HS5700, 언어학습을 위한 자유발화형 음성대화처리 원천기술 개발,
이윤근
- 초록
- 본 발명의 음성 인식을 위한 음향 모델 학습 방법은, N개의 출력 노드에 의해 N개의 상태들을 갖도록 구성된 심층 신경망 기반의 대형 음향 모델과 미전사된(Untranscribed) 대량 음성 데이터를 입력으로 이용하여, M(M 003c# N)개의 출력 노드에 의해 M개의 상태들을 갖도록 구성된 심층 신경망 기반의 소형 음향 모델을 대상으로 비교사 학습(Unsupervised learning)을 수행하고, 사용자 환경과 매칭되는 전사된(transcribed) 소량 음성 데이터를 입력으로 이용하여, 상기 비교사 학습에 의해 학습된 소형 음향 모델을 대상으로 교사 학습(Supervised learning)을 수행하여, 미세 조정된 심층 신경망 기반의 최종 음향 모델을 생성한다.
- KSP 제안 키워드
- Learning methods, Model learning, Supervised Learning, acoustic model, speech recognition, unsupervised learning