ETRI-Knowledge Sharing Plaform

ENGLISH
기술이전 검색
연도 ~ 이전수 키워드

상세정보

한국어 공통음성 DB (휴대폰 음성인식용 단어 DB 등 20종)

전수책임자
김상훈
참여자
강병옥, 강점자, 김갑기, 김상훈, 김승희, 김정세, 김종진, 김현숙, 박경현, 박준, 유미선, 유초롱, 이경태, 이성주, 이수종, 이영직, 전형배, 정의정, 정호영, 최문옥, 최미란
기술이전수
77
이전연도
2004
협약과제
01MT3100, 음성정보처리기반, 이영직
03MC2200, 언어정보처리 기술개발(통합), 이영직
한국어 음성인식용 단어, 숫자, 문장용 엔진의 훈련과 테스트를 위한 음성데이터베이스로서 다양한 길이의 숫자, 지명, 인명, 상호명, PC명령어 문장 등으로 구성되어 있다. 아울러, 영어 낭독체 음성합성DB가 포함되어 있다. 본 기술이전은 산업체, 학계, 연구기관 등에서 음성정보기술 개발의 기반기술로 활용될 것이다.
음성정보처리 기술은 음성을 이용하여 정보를 입출력, 가공하는 기술로서, 선진 각국은 이를 21세기 정보화 사회의 핵심기술로 규정하고 관련 기술개발 및 음성DB 구축에 대규모 투자를 하고 있음. 또한, 2004년 2월 MIT의 테크놀로지 리뷰에서 선정한 세상을 바꿀 떠오르는 10대 기술 중 그 첫 번째로 선정된 Universal Translation 기술의 중심에 자리 잡고 있는 요소기술이 음성기술임. 국내에서는 산업체/학계/연구소 등 유관기관에서 음성정보처리 기술개발을 시도하고 있으나 기반기술이 취약하여, 이의 기반이 되는 한국어 공통음성DB를 시급히 구축하여 공급하고 지원해야 할 필요성이 제기되어 왔음.
ETRI 음성/언어정보연구부에서는 정보통신부 출연 음성정보처리기반기술 확충을 위하여, 국내 가용자원을 활용하여 그 동안 한국어 공통음성DB 구축을 추진하여 왔으며, 2003년도 음성DB 구축결과의 일환으로서, 한국어 음성인식DB 및 영어 합성용DB를 기술이전 하고자 함.
.
* 기술이전 범위를 세부 모듈별로 분류
음성인식기의 Training과 테스트를 위한 음성인식용 DB (단어, 숫자, 문장), 영어 낭독체 음성합성 DB로 크게 구분됨. 기술이전 및 배포단위는 각각 수집 환경별로 세분화하여 DB세트(CD세트)로 구성되며, 배포여건에 따라 가감 예정임.
- 기술이전 단위: 휴대폰 음성인식용 단어DB, 유선전화 음성인식용 단어DB 등 20건
- 한국어 음성인식기의 훈련 및 테스트
- 영어 음성합성기의 훈련 및 테스트
- 단어, 숫자, 문장 합성
- 다양한 음성정보서비스 개발
- 음성DB 수집체계 확립