ETRI Knowledge Sharing Platform : Common Speech Databases for Korean

ETRI-Knowledge Sharing Plaform

기술이전 검색
Year	~	Transaction Count		Keyword

한국어 음성인식용 단어, 숫자, 문장용 엔진의 훈련과 테스트를 위한 음성데이터베이스로서 다양한 길이의 숫자, 지명, 인명, 상호명, PC명령어 문장 등으로 구성되어 있다. 아울러, 영어 낭독체 음성합성DB가 포함되어 있다. 본 기술이전은 산업체, 학계, 연구기관 등에서 음성정보기술 개발의 기반기술로 활용될 것이다.

음성정보처리 기술은 음성을 이용하여 정보를 입출력, 가공하는 기술로서, 선진 각국은 이를 21세기 정보화 사회의 핵심기술로 규정하고 관련 기술개발 및 음성DB 구축에 대규모 투자를 하고 있음. 또한, 2004년 2월 MIT의 테크놀로지 리뷰에서 선정한 세상을 바꿀 떠오르는 10대 기술 중 그 첫 번째로 선정된 Universal Translation 기술의 중심에 자리 잡고 있는 요소기술이 음성기술임. 국내에서는 산업체/학계/연구소 등 유관기관에서 음성정보처리 기술개발을 시도하고 있으나 기반기술이 취약하여, 이의 기반이 되는 한국어 공통음성DB를 시급히 구축하여 공급하고 지원해야 할 필요성이 제기되어 왔음.
ETRI 음성/언어정보연구부에서는 정보통신부 출연 음성정보처리기반기술 확충을 위하여, 국내 가용자원을 활용하여 그 동안 한국어 공통음성DB 구축을 추진하여 왔으며, 2003년도 음성DB 구축결과의 일환으로서, 한국어 음성인식DB 및 영어 합성용DB를 기술이전 하고자 함.

* 기술이전 범위를 세부 모듈별로 분류
음성인식기의 Training과 테스트를 위한 음성인식용 DB (단어, 숫자, 문장), 영어 낭독체 음성합성 DB로 크게 구분됨. 기술이전 및 배포단위는 각각 수집 환경별로 세분화하여 DB세트(CD세트)로 구성되며, 배포여건에 따라 가감 예정임.
- 기술이전 단위: 휴대폰 음성인식용 단어DB, 유선전화 음성인식용 단어DB 등 20건

- 한국어 음성인식기의 훈련 및 테스트
- 영어 음성합성기의 훈련 및 테스트
- 단어, 숫자, 문장 합성
- 다양한 음성정보서비스 개발
- 음성DB 수집체계 확립

ETRI-Knowledge Sharing Plaform

BROWSE

Titles

Detail

ETRI