ETRI Knowledge Sharing Platform : Korean Speech Recognition Technology

ETRI-Knowledge Sharing Plaform

기술이전 검색
Year	~	Transaction Count		Keyword

○ 소프트웨어콘텐츠연구소 지능정보연구본부 음성지능연구그룹에서는 한국어 음성인식 기술을 개발하였음.
○ 한국어 음성인식 기술은 딥러닝 기술 및 대용량 데이터에 기반하여 실현되는 고난이도 융복합 기술임.
○ 다양한 사업모델 창출을 위하여 기술이전을 통하여 관련업체 및 기관에 적극적으로 보급함으로써 관련 시장확대 촉진 및 글로벌 경쟁력을 제고

○ 한국어 음성인식 기술은 지니톡 대국민 시범서비스 및 평창 올림픽 서비스 지원을 통해 실증 검증을 수행하였으며 자동통역서비스, 인공지능 비서, 군사용 음성 인식 기술 등 특정 응용 분야에 대해서는 상용화 수준에 이르렀다고 판단하여 기술이전을 실시하고자 함.
○ Google, 뉘앙스 등 글로벌 경쟁기술이 국내 한국어 음성 인식 시장을 선점하기 이전에 기술이전을 실시하여 기술경쟁력을 강화하고 향후에는 국외시장까지 진출하는 것을 목적으로 함

○ 한국어를 대상으로 명령어 및 자연어 기반의 대어휘 음성인식 및 대화체 연속 음성을 인식
○ 음향모델링, 언어모델링, 디코딩, 음성검출, 음성특징추출, 문장코퍼스 정제기술, 시스템 통합기술, 부호복원 및 오류수정 기술 등 다양한 요소기술로 구성된 복합기술
○ 대화체 문장 등 일상 생활 영역에 특화되었으며, 이에 대한 실용화 성능 확보
○ API규격 및 활용예제 코드 제공으로 용도별 클라이언트 응용프로그램 개발 용이
○ ‘지니톡’ 대국민 시범서비스 실시를 통하여 시스템 안정성 및 활용성 확인 완료
○ 수요업체 용도에 따라 ETRI가 보유한 다양한 외국어 음성인식엔진 및 자동번역 기술과 연계 용이

○ 기술명 : 한국어 음성인식 기술
- 한국어에 대하여 자연스러운 발성을 텍스트 문장으로 자동변환하는 ‘한국어 대어휘 자연어 음성인식’ 기술
- 대표적인 활용분야로써 자동통역 서비스, 인공지능 비서, 딕테이션, 대화형 지능형로봇, 군사용 응용 등에 활용됨
- 한국어 음성인식 기술은 실시간 고속탐색 기술, 다중 발음모델, 딥러닝(DNN: Deep Neural Network) 음향모델(AM: Acoustic Model) 및 통계 기반 언어모델(LM: Language Model)로 구성이 됨
- 서버형 음성인식 기술의 경우, 메모리 용량의 제한 없이 대용량 언어모델을 활용하여 고성능 대용량 음성인식 서비스에 적합함
- 한국어 음성인식 디코더 라이브러리
- 한국어 음성인식 엔진 API 규격
- 한국어 음성인식 활용 예제 코드(서버API 개발 위한 예제 포함)
- 기술 지원 및 교육(엔진 설치 및 응용, Android Client 개발 샘플 등)

○ 다양한 응용업체가 한국어 음성 인식 기술 관련 비즈니스 모델을 개발하게 함으로서 국내외 SW산업 신시장 창출 기대
○ ETRI는 기술이전업체와 공동으로 기술 상용화 시 문제점을 공유하고 해결 노력을 기울임으로써 기술의 완성도를 제고

ETRI-Knowledge Sharing Plaform

BROWSE

Titles

Detail

ETRI