ETRI Knowledge Sharing Platform : Server-based speech recognition technology for mobile environment customer support

기술이전 검색
Year	~	Transaction Count		Keyword

스마트폰, 스마트패드 등 모바일 환경에서 스마트 단말 기반의 음성인식을 위한 서버/클라이언트형 음성인식 기술

ETRI 자동통역언어지능연구부에서는 미래창조과학부 출연 “모바일 플랫폼 기반 대화모델 적용 자연어 음성인터페이스 기술 개발” 및 “언어학습을 위한 자유발화형 음성대화처리 원천기술 개발” 사업을 통해 PC 환경뿐만 아니라 외국어 교육, 차량용 정보서비스를 비롯한 모바일 환경에서 요구하는 음성인터페이스 기술을 개발하고 있다. 현재 국내의 음성기술 전문 솔루션 업체에서는 다양한 정보통신시스템 및 서비스에 음성인터페이스 기술을 적용, 사업화를 추진하고 있으며, 이번에 기술이전을 추진하는 ‘모바일 환경 서버기반 음성인식 기술’은 현재 동 기술을 보유하고 있지 않은 전문 음성인식 솔루션 업체에 기술 이전하여 관련 산업을 활성화하며 개별 기업에서의 중복 기술개발을 피하기 위한 것이다.

- 최신 딥러닝 기술에 기반하는 서버 기반의 연속어 음성인식 기술을 적용하여 높은 정밀도의 음성-문자 변환(speech-to-text conversion) 인터페이스를 제공
- 음성인식 적용 도메인의 음성 및 텍스트 DB를 기반으로 적응학습을 통해 음성인식 성능을 제고하는 도구를 제공

모바일환경 고객지원용 서버기반 음성인식 기술
① 리눅스 환경에서 실행 가능한 Library 형태의 오브젝트 파일과 인식용 이미지파일 생성 도구 (Centos 6.x 이상)
- 서버 기반의 음성인식 엔진 SDK
- 런타임 이미지 생성 도구
- 개발자용 지침서

② 음향 및 언어모델 및 그 적응형 학습도구 (리눅스 환경, Centos 6.x 이상)
- 기본 음향모델 (16kHz 샘플링 주파수) 및 적응 학습 도구
- 기본 언어모델 (10만 단어급) 및 적응 학습 도구

* 제약조건
- 입력 음성 파일은 16kHz 이상의 샘플링 주파수로 인코딩되어 있어야 함
- 적용 언어: 한국어 및 영어를 지원하며 언어별로 별도 기술이전 계약함

본 기술은 모바일 환경에서 음성인식 기술을 사용하여 음성 신호를 문자 정보로 변환함으로써 다양한 스마트 단말에서의 고객응대, 정보검색, 명령/제어, 엔터테인먼트 서비스 등을 포괄하는 사용자 편의형 정보 서비스를 구성할 수 있게 한다.

ETRI-Knowledge Sharing Plaform

BROWSE

Titles

Detail

ETRI