ETRI-Knowledge Sharing Plaform

ENGLISH
기술이전 검색
연도 ~ 이전수 키워드

상세정보

한국인이 발성한 영어음성 DB

전수책임자
박전규
참여자
강병옥, 강점자, 김현우, 박기영, 박상규, 박전규, 송화전, 오유리, 이성주, 이윤경, 이윤근, 전형배, 정의석, 정호영, 정훈, 최우용, 한란
기술이전수
2
이전연도
2018
협약과제
14MS1500, 모바일 플랫폼 기반 대화모델 적용 자연어 음성인터페이스 기술 개발, 이윤근
15MS9500, 언어학습을 위한 자유발화형 음성대화처리 원천기술 개발, 이윤근
16MS1700, 언어학습을 위한 자유발화형 음성대화처리 원천기술 개발, 이윤근
17HS5700, 언어학습을 위한 자유발화형 음성대화처리 원천기술 개발, 이윤근
'한국인이 발성한 영어음성 DB'은 비원어민으로서의 한국인이 발성한 영어 음성을 녹음 및 전사한 DB이다. 일차적으로는 비원어민 한국인이 발성한 영어에 대한 음성인식 성능 개선을 위해 음향모델을 훈련하는 데 활용하며, 이차적으로 발음 유창성 평가를 위한 발음모델 또는 평가모델 훈련 용도로 활용할 수 있다.
ETRI 지능정보연구본부에서는 과학기술정보통신부 출연 “언어학습을 위한 자유발화형 음성대화처리 원천기술 개발” 사업을 통해 비원어민 발성에 대한 음성인식 성능 제고 및 발음평가를 위한 원천핵심기술을 개발하고 있다.
딥러닝 기반의 음성인식 및 발음평가 기술은 빅데이터의 활용 여부에 따라 그 성능에 중요한 영향을 받게 되는데, 특히 비원어민은 자국어의 발음 특성에 기반하여 외국어를 발성하는 특성이 있어 학습 대상 언어에 대해 음성인식 성능이 저하되게 된다. 이러한 성능저하를 극복하기 위해 비원어민의 발성을 충분히 수집하여 음향모델 훈련에 사용함으로써 성능제고에 활용하게 된다. 본 기술이전 대상은 이를 보유하지 못한 기업에 기술 이전하여 관련 산업을 활성화 하며 개별 기업에서의 중복 기술개발을 피하기 위한 것이다
- 비원어민으로서의 한국인이 발성한 영어 문장으로 구성된다.
- 성별 균형된 초중고생 및 일반인의 영어 발성으로 구성된다.
한국인이 발성한 영어음성 DB
① DB명: EK-2014
- 녹음 분량: 약 226시간, 147,568 문장으로 구성
- 녹음 대상: 초중고생
② DB명: EK-2015
- 녹음 분량: 약 120시간, 187,986 문장으로 구성
- 녹음 대상: 초중생, 성인
※ 특이사항: EK-2014 및 EK-2015에 대해 별건으로 계약 가능함
본 기술은 비원어민이 발성하는 영어 음성인식의 성능제고에 기여함에 따라 영어학습 분야 뿐만 아니라 일반적인 정보검색, 정보서비스 등의 응용 서비스/제품에 직접 활용 가능하다.