ETRI-Knowledge Sharing Plaform

KOREAN
기술이전 검색
Year ~ Transaction Count Keyword

Detail

Common Speech Databases for Korean

Manager
Sanghun Kim
Participants
Kang Byung Ok, Kang Jeom Ja, Kim Kap Kee, Sanghun Kim, Kim Seung Hi, Kim Jeong Se, Kim Jong Jin, Hyunsuk Kim, Park Kyoung Hyun, Park Jun, Yu Misun, Yu Cho-Rong, Kyungtae Lee, Sung Joo Lee, Soo-Jong Lee, Young Jik Lee, Jeon Hyung-Bae, Eui Jung Jung, Jung Ho Young, Moonok Choi, Miran Choi
Transaction Count
77
Year
2004
Project Code
03MC2200, Language Information Processing Technology Development, Young Jik Lee
01MT3100, Fundamental Technology of Speech Information Processing, Young Jik Lee
한국어 음성인식용 단어, 숫자, 문장용 엔진의 훈련과 테스트를 위한 음성데이터베이스로서 다양한 길이의 숫자, 지명, 인명, 상호명, PC명령어 문장 등으로 구성되어 있다. 아울러, 영어 낭독체 음성합성DB가 포함되어 있다. 본 기술이전은 산업체, 학계, 연구기관 등에서 음성정보기술 개발의 기반기술로 활용될 것이다.
음성정보처리 기술은 음성을 이용하여 정보를 입출력, 가공하는 기술로서, 선진 각국은 이를 21세기 정보화 사회의 핵심기술로 규정하고 관련 기술개발 및 음성DB 구축에 대규모 투자를 하고 있음. 또한, 2004년 2월 MIT의 테크놀로지 리뷰에서 선정한 세상을 바꿀 떠오르는 10대 기술 중 그 첫 번째로 선정된 Universal Translation 기술의 중심에 자리 잡고 있는 요소기술이 음성기술임. 국내에서는 산업체/학계/연구소 등 유관기관에서 음성정보처리 기술개발을 시도하고 있으나 기반기술이 취약하여, 이의 기반이 되는 한국어 공통음성DB를 시급히 구축하여 공급하고 지원해야 할 필요성이 제기되어 왔음.
ETRI 음성/언어정보연구부에서는 정보통신부 출연 음성정보처리기반기술 확충을 위하여, 국내 가용자원을 활용하여 그 동안 한국어 공통음성DB 구축을 추진하여 왔으며, 2003년도 음성DB 구축결과의 일환으로서, 한국어 음성인식DB 및 영어 합성용DB를 기술이전 하고자 함.
.
* 기술이전 범위를 세부 모듈별로 분류
음성인식기의 Training과 테스트를 위한 음성인식용 DB (단어, 숫자, 문장), 영어 낭독체 음성합성 DB로 크게 구분됨. 기술이전 및 배포단위는 각각 수집 환경별로 세분화하여 DB세트(CD세트)로 구성되며, 배포여건에 따라 가감 예정임.
- 기술이전 단위: 휴대폰 음성인식용 단어DB, 유선전화 음성인식용 단어DB 등 20건
- 한국어 음성인식기의 훈련 및 테스트
- 영어 음성합성기의 훈련 및 테스트
- 단어, 숫자, 문장 합성
- 다양한 음성정보서비스 개발
- 음성DB 수집체계 확립