○ 소프트웨어콘텐츠연구소 지능정보연구본부 음성지능연구그룹에서는 한/영/중/일 순환신경망 기반 단말탑재형 음성인식 기술을 개발하였음.
○ 한/영/중/일 순환신경망 기반 단말형 음성인식 기술은 딥러닝 기술 및 대용량 데이터에 기반하여 실현되는 고난이도 융복합 기술임.
○ 다양한 사업모델 창출을 위하여 기술이전을 통하여 관련업체 및 기관에 적극적으로 보급함으로써 관련 시장확대 촉진 및 글로벌 경쟁력을 제고
○ 한영중일 단말탑재형 음성인식 기술은 지니톡 대국민 시범 서비스 및 평창 올림픽 서비스 지원 및 원어민 테스트 등 실증 검증을 수행하였으며 단말형 자동통역서비스, 단말형 스마트 가전 제어, 단말형 인공 지능 비서 등 특정 응용 분야에 대해서는 상용화 수준에 이르렀다고 판단하여 기술이전을 실시하고자 함.
○ Google, 뉘앙스 등 글로벌 경쟁기술이 국내 한영중일 단말탑재형 음성 인식 시장을 선점하기 이전에 기술이전을 실시하여 기술경쟁력을 강화하고 향후에는 국외시장까지 진출하는 것을 목적으로 함
○ 한국어, 영어, 중국어, 일본어를 대상으로 명령어 및 자연어 기반의 대어휘 음성인식 및 대화체 연속 음성을 인식
○ 음향모델링, 언어모델링, 디코딩, 음성검출, 음성특징추출, 문장코퍼스 정제기술, 시스템 통합기술, 오류수정 기술 등 다양한 요소기술로 구성된 복합기술
○ 대화체 문장 등 일상 생활 영역에 특화되었으며, 이에 대한 실용화 성능 확보
○ API규격 및 활용예제 코드 제공으로 용도별 클라이언트 응용프로그램 개발 용이
○ ‘지니톡 대국민 시범서비스’ 및 ‘2018 평창올림픽’ 자동통역 서비스 실시를 통해 검증된 시스템 안정성 및 활용성 확인 완료
○ 수요업체 용도에 따라 ETRI가 보유한 다양한 외국어 음성인식엔진 및 자동번역 기술과 연계 용이
- 한국어, 영어, 중국어, 일본어에 대하여 자연스러운 발성을 텍스트 문장으로 자동변환하는 순환신경망 기반 단말탑재형 ‘대어휘 자연어 음성인식’ 기술
- 대표적인 활용분야로써 단말탑재형 자동통역 서비스, 단말탑재형 스마트 가전 제어, 단말탑재형 인공지능 비서, 단말탑재형 대화형 지능형로봇 등에 활용됨
- 단말탑재형 한국어, 영어, 중국어, 일본어 음성인식 기술은 실시간 고속탐색 기술, 다중 발음모델, 딥러닝(DNN: Deep Neural Network) 음향모델(AM: Acoustic Model) 및 통계 기반 언어모델(LM: Language Model)로 구성이 됨
- 단말탑재형 음성인식 기술의 경우, 통신의 제한 없이 음성인식을 실시함에 따라 독립형 음성인식 서비스에 적합함
- 순환신경망 기반 단말탑재형 음성인식 디코더 라이브러리
- 순환신경망 기반 단말탑재형 음성인식 엔진 API 규격
- 순환신경망 기반 단말탑재형 음성인식 활용 예제 코드
- 순환신경망 기반 단말탑재형 한국어, 영어, 중국어, 일본어 음성인식 리소스
- 기술 지원 및 교육(Android Client 개발 샘플 등)
○ 다양한 응용업체가 한국어, 영어, 일본어, 중국어 단말탑재형 음성 인식 기술 관련 비즈니스 모델을 개발하게 함으로서 국내외 SW산업 신시장 창출 기대
○ ETRI는 기술이전업체와 공동으로 기술 상용화 시 문제점을 공유하고 해결 노력을 기울임으로써 기술의 완성도를 제고