ETRI-Knowledge Sharing Plaform

ENGLISH
기술이전 검색
연도 ~ 이전수 키워드

상세정보

음성인식용 발음사전 생성 기술

전수책임자
박전규
참여자
강병옥, 강점자, 김현우, 박기영, 박상규, 박전규, 송화전, 오유리, 이성주, 이윤경, 이윤근, 전형배, 정의석, 정호영, 정훈, 최우용, 한란
기술이전수
1
이전연도
2018
협약과제
12MS1500, 모바일 플랫폼 기반 대화모델 적용 자연어 음성인터페이스 기술 개발, 이윤근
13VS1500, 모바일 플랫폼 기반 대화모델 적용 자연어 음성인터페이스 기술 개발, 이윤근
16MS1700, 언어학습을 위한 자유발화형 음성대화처리 원천기술 개발, 이윤근
18HS3700, 언어학습을 위한 자유발화형 음성대화처리 원천기술 개발, 이윤근
17HS5700, 언어학습을 위한 자유발화형 음성대화처리 원천기술 개발, 이윤근
'음성인식용 발음사전 생성 기술'은 문자 정보를 발음 정보로 자동 변환하는 기술이다. 음성인식은 사람의 말(발음)을 인식하여 문자정보로 변환하는 기술이므로 문자로부터 발음열을 자동으로 변환하는 기술이 중요한 핵심기술요소가 된다.
문자를 발음열로 정확히 변환하기 위해서는 기본 변환 규칙이 필요하며, 문장의 구조를 분석하는 형태소 분석기, 불규칙 변환 정보를 저장하는 사전 등이 필요하다. 문자-발음열 변환에서 오류가 발생하면 음성인식 정확도에 악영향을 미치므로 문자-발음열 변환 기술의 성능이 전체 음성인식 성능에 중요한 영향을 미친다. 하지만, 언어에는 많은 불규칙적 요소가 포함되어 있으므로 이를 컴퓨터가 정확히 처리하도록 하기 위해서는 많은 연구가 필요한 분야이다.
ETRI 지능정보연구본부에서는 과학기술정보통신부 출연 “언어학습을 위한 자유발화형 음성대화처리 원천기술 개발” 사업을 통해 PC 환경뿐만 아니라 모바일 환경에서 요구되는 비정형 자연어 음성인식 및 대화처리 기술 기반의 음성인터페이스 원천핵심기술을 개발하고 있다.
음성인식의 주요 요소기술인 문자-발음 변환 기술도 지속적으로 연구, 개선을 진행하고 있으며 본 기술이전 대상은 이를 보유하지 못한 기업에 기술 이전하여 관련 산업을 활성화 하며 개별 기업에서의 중복 기술개발을 피하기 위한 것이다
- 한국어 및 영어에 대한 발음변환 기술을 지원한다.
- 한국어에 대해서는 규칙기반, 사용자사전, 운율어 기반의 예외발성사전을 생성하여 다양하고 풍부한 발음열 생성이 가능하다.
- 영어에 대해서는 데이터 기반의 발음열 생성을 지원한다. 특히 수작업으로 생성된 미국식 인명 및 지명 사전을 포함한다.
음성인식용 발음사전 생성 기술
- 다중발음 생성이 가능한 문자열-발음열 변환 기술
① 발음변환 프로그램 실행파일 (바이너리 포맷)
- 문자열에 대해 다중발음열을 ASCII 포맷으로 출력
- 실행 설명서
② 발음변환을 위한 지식베이스 (바이너리 포맷)
- 한국어: 기본 불규칙 사전, 형태소 사전 및 바이그램, 영어발성 사전
- 영어: 기본 발음 사전, 텍스트 정규화를 위한 사전
※ 특이사항: 한국어 및 영어를 지원하며, 언어별로 별건으로 기술이전 계약함
본 기술은 음성인식 응용 서비스/제품에 직접 활용 가능하다.