ETRI-Knowledge Sharing Plaform

KOREAN
연구보고서 검색
Type Funding Org. Research Org.
Year ~ Keyword

Detail

HCI를 위한 음성 입출력 처리 기술 개발 (최종)
Download 17 time
Participants
Published
199812
Type
Final Report
Keyword
개발 플랫폼, 음성 인식 모듈, 음성 합성 모듈, 음성 명령 입출력 인터페이스
KSP Keywords
Computer interface, Processing Technology, Speech input, human computer interface
Funding Org.
정보통신부
Research Org.
한국전자통신연구원
Project Code
98MT2100, BASYS DataMig, Young Jik Lee
Abstract
본 과제는 1997년부터 1998년까지 2년에 걸쳐 화자 변이, 작업영역 변 이, 잡은환경 변이에 적응하는 가변어휘 음성명령 사용자 접속 소프트웨어 를 개발하고자 한다. 이 소프트웨어는 아래와 같은 기능을 갖는다.
■ 개인용 컴퓨터 윈도우즈 95/NT 상에서 음성명령 구동
■ 마우스 동작 대체 및 연동으로 사용자 편이성 제고
■ 작업의 종류에 따라 달라지는 인식대상 음성명령어 실시간 수용
■ 시스템 메시지를 자연스러운 합성음으로 출력
■ 잡음환경이나 사용자에 적응하여 동작
위의 기능을 갖는 소프트웨어의 개발을 위해 1997년에는 음성명령 입출 력 규격정의 및 기본모듈 개발을 수행하였고, 1998년에는 음성인식 모듈, 음성합성 모듈 및 음성입출력 인터페이스를 개발하였다. 다음은 음성입출력 인터페이스 개발을 위한 세부 연구 내용이다.
■ 연구개발체계 관련문서
- 시스템 규격서, 설계서, 시험절차서, 시험결과서
■ 개발플랫폼 (음성 웹 브라우저) 구축
- 개발 플랫폼 설계 및 구현
- 음성입출력 기본모듈 구현 - 음성명령 데이터베이스 수집
- 기본모듈 성능실험 및 평가
■ 음성인식 모듈 개발
- SAPI 단어인식 기술 개발
- 한국식 영어발성 인식기술 개발
- 화자적응 / 미등록어 검출기술 개발
■ 음성합성 모듈 개발 - 학습형 합성기술 개발
- SAPI 일기예보 합성기술 개발
■ 음성명령입출력 인터페이스 소프스트웨어 개발
- SAPI 규격에 맞는 라이브러리 구축
- 음성 인식/합성 라이브러리 실시간화
- Windows 95/NT 음성명령 기술 개발
- 시스템 메시지 / 임의 문장 합성음성 출력
■ 업체공동연구 / 기반기술 연구
- 업체공동연구: 음성명령 게임 (삼보컴퓨터), 음성인식 ARS (LG정보통신), ARS용 가변어휘 인식(범일정보통신)
- 음성입출력 기반기술연구그룹: 음성입출력 사용자 인터페이스 소프트웨어 개발, 에코제거 알고리즘 개발, 화자인식 알고리즘 개발, 음운 지속시간 통계