ETRI-Knowledge Sharing Plaform

KOREAN
기술이전 검색
Year ~ Transaction Count Keyword

Detail

Korean/English/Chinese/Japanese RNN embedded speech recognition technology

Manager
Yun Seung
Participants
Kim Dong Hyun, Sanghun Kim, Kim Seung Hi, Yeojeong Kim, Kim Jeong Se, Park Sang Kyu, Park Jun, Yun Seung, Min Kyu Lee, Young Jik Lee, Lee Yunkeun, Choi Mu Yeol
Transaction Count
1
Year
2019
Project Code
17HS1700, Core technology development of the real-time simultaneous speech translation based on knowledge enhancement, Kim Young Kil
16HS1300, Core technology development of the real-time simultaneous speech translation based on knowledge enhancement, Kim Young Kil
17ZS1200, 언어장벽 없는 국가 구현을 위한 자동통번역 산업 경쟁력 강화 사업, Sanghun Kim
16ZS1100, 언어장벽 없는 국가 구현을 위한 자동통번역 산업 경쟁력 강화 사업, Sanghun Kim
○ 소프트웨어콘텐츠연구소 지능정보연구본부 음성지능연구그룹에서는 한/영/중/일 순환신경망 기반 단말탑재형 음성인식 기술을 개발하였음.
○ 한/영/중/일 순환신경망 기반 단말형 음성인식 기술은 딥러닝 기술 및 대용량 데이터에 기반하여 실현되는 고난이도 융복합 기술임.
○ 다양한 사업모델 창출을 위하여 기술이전을 통하여 관련업체 및 기관에 적극적으로 보급함으로써 관련 시장확대 촉진 및 글로벌 경쟁력을 제고
○ 한영중일 단말탑재형 음성인식 기술은 지니톡 대국민 시범 서비스 및 평창 올림픽 서비스 지원 및 원어민 테스트 등 실증 검증을 수행하였으며 단말형 자동통역서비스, 단말형 스마트 가전 제어, 단말형 인공 지능 비서 등 특정 응용 분야에 대해서는 상용화 수준에 이르렀다고 판단하여 기술이전을 실시하고자 함.
○ Google, 뉘앙스 등 글로벌 경쟁기술이 국내 한영중일 단말탑재형 음성 인식 시장을 선점하기 이전에 기술이전을 실시하여 기술경쟁력을 강화하고 향후에는 국외시장까지 진출하는 것을 목적으로 함
○ 한국어, 영어, 중국어, 일본어를 대상으로 명령어 및 자연어 기반의 대어휘 음성인식 및 대화체 연속 음성을 인식
○ 음향모델링, 언어모델링, 디코딩, 음성검출, 음성특징추출, 문장코퍼스 정제기술, 시스템 통합기술, 오류수정 기술 등 다양한 요소기술로 구성된 복합기술
○ 대화체 문장 등 일상 생활 영역에 특화되었으며, 이에 대한 실용화 성능 확보
○ API규격 및 활용예제 코드 제공으로 용도별 클라이언트 응용프로그램 개발 용이
○ ‘지니톡 대국민 시범서비스’ 및 ‘2018 평창올림픽’ 자동통역 서비스 실시를 통해 검증된 시스템 안정성 및 활용성 확인 완료
○ 수요업체 용도에 따라 ETRI가 보유한 다양한 외국어 음성인식엔진 및 자동번역 기술과 연계 용이
- 한국어, 영어, 중국어, 일본어에 대하여 자연스러운 발성을 텍스트 문장으로 자동변환하는 순환신경망 기반 단말탑재형 ‘대어휘 자연어 음성인식’ 기술
- 대표적인 활용분야로써 단말탑재형 자동통역 서비스, 단말탑재형 스마트 가전 제어, 단말탑재형 인공지능 비서, 단말탑재형 대화형 지능형로봇 등에 활용됨
- 단말탑재형 한국어, 영어, 중국어, 일본어 음성인식 기술은 실시간 고속탐색 기술, 다중 발음모델, 딥러닝(DNN: Deep Neural Network) 음향모델(AM: Acoustic Model) 및 통계 기반 언어모델(LM: Language Model)로 구성이 됨
- 단말탑재형 음성인식 기술의 경우, 통신의 제한 없이 음성인식을 실시함에 따라 독립형 음성인식 서비스에 적합함
- 순환신경망 기반 단말탑재형 음성인식 디코더 라이브러리
- 순환신경망 기반 단말탑재형 음성인식 엔진 API 규격
- 순환신경망 기반 단말탑재형 음성인식 활용 예제 코드
- 순환신경망 기반 단말탑재형 한국어, 영어, 중국어, 일본어 음성인식 리소스
- 기술 지원 및 교육(Android Client 개발 샘플 등)
○ 다양한 응용업체가 한국어, 영어, 일본어, 중국어 단말탑재형 음성 인식 기술 관련 비즈니스 모델을 개발하게 함으로서 국내외 SW산업 신시장 창출 기대
○ ETRI는 기술이전업체와 공동으로 기술 상용화 시 문제점을 공유하고 해결 노력을 기울임으로써 기술의 완성도를 제고