○ 한국어 연속 음성인식 엔진 (Cento6.0, Ubunt14.04버전 이상, 엔진 라이브러리, 서버-클라이언트 샘플 바이너리, 16kHz 및 8kHz 지원(단, 샘플링 주파수에 따라 별도 기술이전 계약이 필요함)
- wFST 기반 고속탐색 기술 (최적화된 wFST 이미지를 이용하여 입력 음성을 텍스트로 실시간으로 고속 변환하는 기술) CPU 기반, core당 1채널 지원 최소 사양 : Intel 2세대 샌디브릿지(2011년 말 출시) AVX(Advanced Vector eXtensions) 지원 CPU
- 딥러닝 기반 음향모델 (한국어 음성으로부터 음소단위 발음 특성을 학습한 음향모델. 기본 베이스라인 모델 제공)
- N-gram 기반 언어모델 (한국어 텍스트로부터 단어 간의 문법적 관계를 추출한 통계모델. 기본 베이스라인 모델 제공)
○ 엔진 튜닝 도구 (Centos6.0이상 리눅스 이상, 바이너리 제공)
- 전처리 및 발음변환 기술 (숫자, 심볼 등이 포함된 문장으로부터 한글표현으로 변환하고, 단어의 발음을 추출하는 기술. 단, 특수 코드 등 예외 입력에 대해 별도 처리 필요)
- 언어모델 튜닝 기술 (새로운 영역에서 추출한 문장표현을 기존 언어모델에 튜닝하는 기술. 오픈소스인 SRI toolkit 이용)
- 음향모델 튜닝 기술 (새로운 발성환경에서 수집한 음성데이터를 기존 음향모델에 튜닝하는 딥러닝 학습 기술. 오픈소스인 Kaldi 이용)
- wFST 이미지 최적화 기술 (새로운 음향/언어모델로부터 최적화된 이미지 생성 기술)
○ 한국어 음성인식 소프트웨어(기본 베이스라인 음향모델/언어모델 binary 및 음성인식 엔진 튜닝 도구 포함)
○ 관련 기술문서 및 지적재산권(별도 기재)