ETRI-Knowledge Sharing Plaform

KOREAN
기술이전 검색
Year ~ Transaction Count Keyword

Detail

Russian Speech Recognition Technology

Manager
Yun Seung
Participants
Kim Dong Hyun, Sanghun Kim, Kim Seung Hi, Yeojeong Kim, Kim Jeong Se, Park Sang Kyu, Park Jun, Yun Seung, Min Kyu Lee, Young Jik Lee, Lee Yunkeun, Choi Mu Yeol
Transaction Count
1
Year
2018
Project Code
16HS1300, Core technology development of the real-time simultaneous speech translation based on knowledge enhancement, Kim Young Kil
17ZS1200, 언어장벽 없는 국가 구현을 위한 자동통번역 산업 경쟁력 강화 사업, Sanghun Kim
16ZS1100, 언어장벽 없는 국가 구현을 위한 자동통번역 산업 경쟁력 강화 사업, Sanghun Kim
○ 소프트웨어콘텐츠연구소 지능정보연구본부 음성지능연구그룹에서는 러시아어 음성인식 기술을 개발하였음.
○ 러시아어 음성인식 기술은 딥러닝 기술 및 대용량 데이터에 기반하여 실현되는 고난이도 융복합 기술임.
○ 현재 러시아어 음성인식 기술은 오랜 기간의 연구개발을 거쳐 최근 실용화 수준으로 향상되었으며, 여러 특정 서비스 분야에서 실환경에 적용되고 있음.
○ 러시아어 음성인식 기술은 평창 올림픽 자동통역 서비스 지원을 통해 실증 검증을 수행하였으며 자동통역서비스, 스마트 가전 제어, 인공 지능 비서 등 특정 응용 분야에 대해서는 상용화 수준에 이르렀다고 판단하여 기술이전을 실시하고자 함.
○ Google, 뉘앙스 등 글로벌 경쟁기술이 국내 러시아어 음성 인식 시장을 선점하기 이전에 기술이전을 실시하여 기술경쟁력을 강화하고 향후에는 국외시장까지 진출하는 것을 목적으로 함
○ 러시아어를 대상으로 명령어 및 자연어 기반의 대어휘 음성인식 및 대화체 연속 음성을 인식
○ 음향모델링, 언어모델링, 디코딩, 음성검출, 음성특징추출, 문장코퍼스 정제기술, 시스템 통합기술, 오류수정 기술 등 다양한 요소기술로 구성된 복합기술
○ 대화체 문장 등 일상 생활 영역에 특화되었으며, 이에 대한 실용화 성능 확보
○ API규격 및 활용예제 코드 제공으로 용도별 클라이언트 응용프로그램 개발 용이
○ ‘2018 평창올림픽’ 자동통역 서비스 실시를 통하여 시스템 안정성 및 활용성 확인 완료
○ 수요업체 용도에 따라 ETRI가 보유한 다양한 외국어 음성인식엔진 및 자동번역 기술과 연계 용이
- 러시아어에 대하여 자연스러운 발성을 텍스트 문장으로 자동변환하는 ‘러시아어 대어휘 자연어 음성인식’ 기술
- 대표적인 활용분야로써 자동통역 서비스, 스마트 가전 제어, 인공지능 비서, 대화형 지능형로봇 등에 활용됨
- 러시아어 음성인식 기술은 실시간 고속탐색 기술, 다중 발음모델, 딥러닝(DNN: Deep Neural Network) 음향모델(AM: Acoustic Model) 및 통계 기반 언어모델(LM: Language Model)로 구성이 됨
- 서버형 음성인식 기술의 경우, 메모리 용량의 제한 없이 대용량 언어모델을 활용하여 고성능 대용량 음성인식 서비스에 적합함
- 러시아어 음성인식 디코더 라이브러리
- 러시아어 음성인식 엔진 API 규격
- 러시아어 음성인식 활용 예제 코드(서버API 개발 위한 예제 포함)
- 기술 지원 및 교육(엔진 설치 및 응용, Android Client 개발 샘플 등)
○ 다양한 응용업체가 러시아어 음성 인식 기술 관련 비즈니스 모델을 개발하게 함으로서 국내외 SW산업 신시장 창출 기대
○ ETRI는 기술이전업체와 공동으로 기술 상용화 시 문제점을 공유하고 해결 노력을 기울임으로써 기술의 완성도를 제고