o 기술이전의 내용
가. 1세부기술 : 딥러닝 기반의 서버형 음성인식 기술(Ver.2019)
1. 탐색 엔진 (search engine 또는 decoder)
- 음향 및 언어 모델 등의 지식 베이스에 기반하여 고속/고성능 음성인식 기능을 수행함
- 문장형태의 음성인식을 위해 연속어 음성인식 엔진을 사용함
- 음성인식 결과에 대해 단어별 시간경계 정보를 출력함
※ WFST(Weighted Finite State Transducer) 기술 특성상 시간경계 정보가 실제 경계와 완전히 일치하지 않을 수 있음
2. 음향 모델
- 사무실 및 모바일 환경의 일반적 음성 및 잡음이 반영된 기본 베이스라인 모델을 제공함
- 베이스라인 모델에 대해 적용 영역의 소규모 데이터를 사용하여 학습을 수행하는 적응학습 도구를 제공함
- 심층신경망(Deep Neural Network) 모델을 지원함
3. 언어 모델
- 발음 변환 도구, 통계적 언어 모델 생성을 지원함으로써 새로운 음성인식용 태스크 또는 콘텐츠 입력 자료에 대해 음성인식용 발성사전과 문법 생성 환경을 제공함
- 기본으로 제공되는 베이스라인 통계 언어 모델에 대해 적용 영역의 데이터를 사용하여 학습을 수행하는 적응학습 도구를 제공함
4. 인식 후처리 도구
- 음성인식 엔진에서 출력되는 형태소열에 대해 어절을 복원하고 문장단위로 출력하도록 지원함 (※ 단, 통계 및 예제 기반의 어절 복원 논리 및 알고리즘을 적용하므로, 신조어나 알려지지 않은 형태소열에 대해서는 완전한 후처리가 어려울 수 있음)
5. 이미지 생성 도구
- 음성인식 엔진에서 인식에 필요한 외부파일에 대해 이미지 형태로 생성하기 위한 이미지 생성 도구를 제공함
6. 지원 언어: 한국어, 영어 (※ 언어별로 별건 계약함. 언어별로 언어 처리 도구 및 자원, 음향 및 언어 모델이 상이함)
7. 지원 샘플링주파수: 8kHz, 16kHz (※ 샘플링주파수별로 별건 계약함. 샘플링주파수별로 훈련용 빅데이터 및 음향 모델이 상이함)
나. 2세부기술 : MS 윈도우즈용 딥러닝 기반의 서버형 음성인식 기술(Ver.2019)
- “딥러닝 기반의 서버형 음성인식 기술(Ver.2019)”의 탐색 엔진을 MS 윈도우즈OS 상에서 구동될 수 있도록 컴파일 가능한 정적 라이브러리를 제공
- 기타 도구는 리눅스 상에서 수행하며 “딥러닝 기반의 서버형 음성인식 기술(Ver.2019)” 기술에서 제공하는 것을 사용함
o 기술이전의 범위
가. 1세부기술 : 딥러닝 기반의 서버형 음성인식 기술(Ver.2019)
1. 리눅스 환경에서 실행 가능한 Library 형태의 오브젝트 파일과 인식용 이미지파일 생성 도구 (리눅스 Centos 7.x 이상)
- 서버 기반의 음성인식 엔진 SDK
- 런타임 이미지 생성 도구
- 개발자용 지침서
2. 음향 및 언어모델 및 그 적응형 학습도구 (리눅스 Centos 7.x 이상)
- 기본 음향모델 및 적응 학습 도구
- 기본 언어모델 및 적응 학습 도구
- 개발자용 지침서
나. 2세부기술 : MS 윈도우즈용 딥러닝 기반의 서버형 음성인식 기술(Ver.2019)
- MS 윈도우즈 환경에서 실행 가능한 Library 형태의 오브젝트 파일 (MS Windows 10 이상) [PG20170431]
* 제약조건 : “딥러닝 기반의 서버형 음성인식 기술(Ver.2019)“ 기술을 사전에 또는 동시에 이전 받은 업체만 계약 가능함