ETRI-Knowledge Sharing Plaform

ENGLISH
기술이전 검색
연도 ~ 이전수 키워드

상세정보

N-gram 기반 영어 대화체 문장분리 기술 (용도제한: 콜센터 서비스)

전수책임자
권오욱
참여자
권오욱, 김영길, 김운, 김창현, 노윤형, 서영애, 신종훈, 이기영, 이윤근, 최승권, 황금하
기술이전수
1
이전연도
2016
협약과제
14MS1500, 모바일 플랫폼 기반 대화모델 적용 자연어 음성인터페이스 기술 개발, 이윤근
15MS9500, 언어학습을 위한 자유발화형 음성대화처리 원천기술 개발, 이윤근
16MS1700, 언어학습을 위한 자유발화형 음성대화처리 원천기술 개발, 이윤근
- 문장 분리 및 문장 부호가 없는 영어 대화체 텍스트에서 문장을 분리하고 적합한 문장 부호를 첨가하는 영어 문장분리 기술
- 사용자의 발화를 음성인식한 경우, 문장 분리나 문장 부호가 일반적으로 없기 때문에 문장단위로 처리해야 하는 번역, 대화처리, 통계분석 등에서 전처리로 필요한 기술임.

- 콜센터의 음성인식 녹취록에서 문장분리 및 문장 기호가 없는 문제를 해결하기 위한 기술임.
- 영어 텍스트의 문장 분리와 문장경계(".", "?", "!") 구두점과 문법기호(",")를 구분
- 고성능 영어 형태소 분석 기술 이용
- 대용량 대화체 코퍼스에서 추출한 문장분리용 통계정보 활용
- N-gram 기반 영어 대화체 문장 분리 기술 (용도제한: 콜센터 서비스)
: N-gram 기반 영어 대화체 문장분리 엔진 및 처리 지식
- N-gram 기반 영어 대화체 문장 분리 바이너리 라이브러리 및 바이너리 처리 지식 DB (용도제한: 콜센터 서비스)
: N-gram 기반 영어 문장분리 엔진의 바이너리 라이브러리 파일 및 API
: 영어 대화체 문장분리 지식 바이너리 DB
- 본 이전기술은 문장부호가 없는 영어 대화체 텍스트 처리에 활용 가능함.

: 영어 콜센터 녹취록 문장 분리
: 영어 학습용 SW의 영어 문장 분리
: 영어 음성대화시스템의 음성인식 결과 문장 분리