ETRI-Knowledge Sharing Plaform

ENGLISH
기술이전 검색
연도 ~ 이전수 키워드

상세정보

베트남어 음성인식기술

전수책임자
윤승
참여자
김동현, 김상훈, 김승희, 김여정, 김정세, 박상규, 박준, 윤승, 이민규, 이영직, 이윤근, 최무열
기술이전수
1
이전연도
2018
협약과제
16HS1300, 지식증강형 실시간 동시통역 원천기술 개발, 김영길
16ZS1100, 언어장벽 없는 국가 구현을 위한 자동통번역 산업 경쟁력 강화 사업, 김상훈
17ZS1200, 언어장벽 없는 국가 구현을 위한 자동통번역 산업 경쟁력 강화 사업, 김상훈
○ 소프트웨어콘텐츠연구소 지능정보연구본부 음성지능연구그룹에서는 베트남어 음성인식 기술을 개발하였음.
○ 베트남어 음성인식 기술은 딥러닝 기술 및 대용량 데이터에 기반하여 실현되는 고난이도 융복합 기술임.
○ 현재 베트남어 음성인식 기술은 최근 실용화 수준으로 향상되었으며, 여러 특정 서비스 분야에서 실환경에 적용되고 있음.
○ 베트남어 음성인식 기술은 원어민 테스트 등 실증 검증을 수행하였으며 자동통역서비스, 스마트 가전 제어, 인공 지능 비서 등 특정 응용 분야에 대해서는 상용화 수준에 이르렀다고 판단하여 기술이전을 실시하고자 함.
○ Google, 뉘앙스 등 글로벌 경쟁기술이 국내 베트남어 음성 인식 시장을 선점하기 이전에 기술이전을 실시하여 기술경쟁력을 강화하고 향후에는 국외시장까지 진출하는 것을 목적으로 함
○ 베트남어를 대상으로 명령어 및 자연어 기반의 대어휘 음성인식 및 대화체 연속 음성을 인식
○ 음향모델링, 언어모델링, 디코딩, 음성검출, 음성특징추출, 문장코퍼스 정제기술, 시스템 통합기술, 오류수정 기술 등 다양한 요소기술로 구성된 복합기술
○ 대화체 문장 등 일상 생활 영역에 특화되었으며, 이에 대한 실용화 성능 확보
○ API규격 및 활용예제 코드 제공으로 용도별 클라이언트 응용프로그램 개발 용이
○ ‘지니톡 대국민 시범서비스’ 및 ‘2018 평창올림픽’ 자동통역 서비스 실시를 통해 검증된 다국어 음성인식기술과 동일한 플랫폼으로 개발됨에 따라 안정성 확보
○ 수요업체 용도에 따라 ETRI가 보유한 다양한 외국어 음성인식엔진 및 자동번역 기술과 연계 용이
- 베트남어에 대하여 자연스러운 발성을 텍스트 문장으로 자동변환하는 ‘베트남어 대어휘 자연어 음성인식’ 기술
- 대표적인 활용분야로써 자동통역 서비스, 스마트 가전 제어, 인공지능 비서, 대화형 지능형로봇 등에 활용됨
- 베트남어 음성인식 기술은 실시간 고속탐색 기술, 다중 발음모델, 딥러닝(DNN: Deep Neural Network) 음향모델(AM: Acoustic Model) 및 통계 기반 언어모델(LM: Language Model)로 구성이 됨
- 서버형 음성인식 기술의 경우, 메모리 용량의 제한 없이 대용량 언어모델을 활용하여 고성능 대용량 음성인식 서비스에 적합함
- 베트남어 음성인식 디코더 라이브러리
- 베트남어 음성인식 엔진 API 규격
- 베트남어 음성인식 활용 예제 코드(서버API 개발 위한 예제 포함)
- 기술 지원 및 교육(엔진 설치 및 응용, Android Client 개발 샘플 등)
○ 다양한 응용업체가 베트남어 음성 인식 기술 관련 비즈니스 모델을 개발하게 함으로서 국내외 SW산업 신시장 창출 기대
○ ETRI는 기술이전업체와 공동으로 기술 상용화 시 문제점을 공유하고 해결 노력을 기울임으로써 기술의 완성도를 제고