ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

논문 검색
구분 SCI
연도 ~ 키워드

상세정보

학술지 종단형 음성인식에서의 인식 유닛에 따 른 언어모델 연구
Cited - time in scopus Download 10 time Share share facebook twitter linkedin kakaostory
저자
전형배, 강병옥, 정훈, 오유리, 이윤경, 강점자, 박전규
발행일
202106
출처
정보과학회 컴퓨팅의 실제 논문지, v.27 no.6, pp.255-262
ISSN
2383-6318
출판사
한국정보과학회
DOI
https://dx.doi.org/10.5626/KTCP.2021.27.6.255
협약과제
20HS1700, 준지도학습형 언어지능 원천기술 및 이에 기반한 외국인 지원용 한국어 튜터링 서비스 개발, 이윤근
초록
본 논문에서는 종단형 음성인식에서의 인식 유닛 선정과 인식 성능과의 관계를 영어 및 한국어 음성인식 환경에서 살펴보았다. 종단형 음성인식의 인식 유닛은 글자(character), 형태소, 단어 등으로 정의하여 모델 학습을 할 수 있다. 본 논문에서는 이 중 기본이 되는 글자(character) 유닛과 데이터로부터 정의 가능한 wordpiece model(WPM)을 비교 실험하였다. 종단형 음성인식 방법은 디코딩 과정에서 외부 언어모델과 fusion을 통한 디코딩이 가능하다. 글자 유닛과 wordpiece 유닛에 대해 적절한 언어모델을 학습 후 언어모델 fusion 기반 음성인식을 수행하였다. 글자 유닛을 적용하는 종단형 음성인식의 경우 종단형 모델의 출력 유닛 개수가 적어 빠르게 모델이 수렴하는 특징이 있다. 영어 음성인식 환경에서는 글자 유닛을 적용한 종단형 모델 성능이 wordpiece 유닛을 적용한 종단형 모델 보다 낮게 관측되었다. 적절한 언어모델을 적용하여 디코딩을 수행하는 경우 양쪽 모두 유사한 최종 성능을 얻었으나, 언어모델의 유닛 개수 차이로 인하여 wordpiece 모델을 출력 유닛으로 하는 종단형 음성인식 모델이 인식 속도 측면에서 상대적으로 좋은 성능을 보였다.