ETRI-Knowledge Sharing Plaform

ENGLISH
기술이전 검색
연도 ~ 이전수 키워드

상세정보

형태소 분석 기반 한국어 구어체 전처리기

전수책임자
김창현
참여자
권오욱, 김강일, 김영길, 김운, 김창현, 나승훈, 노윤형, 박상규, 박은진, 서영애, 신종훈, 이기영, 이윤근, 정상근, 최승권, 황금하
기술이전수
1
이전연도
2015
협약과제
12VS1500, 지식학습 기반의 다국어 확장이 용이한 관광/국제행사 통역률 90%급 자동 통번역 소프트웨어 원천 기술 개발, 김영길
13VS3500, 지식학습 기반의 다국어 확장이 용이한 관광/국제행사 통역률 90%급 자동 통번역 소프트웨어 원천 기술 개발, 김영길
14MS5500, 지식학습 기반의 다국어 확장이 용이한 관광/국제행사 통역률 90%급 자동 통번역 소프트웨어 원천 기술 개발, 김영길
­ 본 이전기술은, 한국어 구어체 문장에 대해 간투사, 도치, 문장부호 누락, 철자 오류 현상 처리 및 문두 단어 처리 등을 수행함.
- 본 이전기술의 목적은 한국어 구어체 문장에 대해 자동번역이 어려운 문장을 자동번역이 용이한 형태로 바꾸어 주는 형태소 분석 기반 전처리기를 제공하는 것임

- 한국의 경제, 과학기술을 비롯한 전체적인 발전과 더불어 한류의 확대 등으로 한국어 구어체에 대한 자동번역 기술의 요구가 급격히 증가하고 있으며, 이에 따라 한국어 구어체에 많이 나타나지만 이로 인해 번역이 어려워지는 간투사, 도치, 문장부호 누락, 철자 오류 현상 처리 및 문두 단어 처리 등에 대한 기술이 요구됨.
본 이전기술은, 한국어 구어체 문장에 대해 간투사, 도치, 문장부호 누락, 철자 오류 현상 처리 및 문두 단어 처리 등을 수행함으로써 자동번역이 쉽지 않은 문장을 자동번역이 용이한 형태로 바꾸어 줄 수 있다.

이를 통해, 기존에는 구어체의 어려운 현상들을 해결함으로써 여러 응용 분야의 결과물을 더욱 개선시킬 수 있게 된다. 예를 들어 자동번역에서와 같이 처리가 어려워 번역이 쉽지 않았던 구어체 문장들에 대해 더 우수한 번역 결과를 제공할 수 있다.
- 한국어 전처리 엔진 라이브러리
- 기계학습 기반 한국어 형태소 분석 엔진 라이브러리
- 기계학습 기반 한국어 형태소 분석 지식
- 한국어 전처리 엔진 라이브러리
: 한국어 간투사, 도치, 문장부호 누락, 철자 오류 현상 처리 및 문두 단어 처리를 수행하는 전처리 엔진 라이브러리 및 API (Windows용 및 Linux용)

- 기계학습 기반 한국어 형태소 분석 엔진 라이브러리
: 한국어 구어체 문장에 대해 형태소 분석을 수행하는 엔진 라이브러리 및 API (Windows용 및 Linux용)

- 기계학습 기반 한국어 형태소 분석 지식
: 기계학습 기반 한국어 형태소 분석기를 위한 학습 사전
- 한국어 구어체 정보검색, 구문분석 등 한국어 자연어 처리 응용분야에 사용
- 한국어 관련 자동번역 및 통역 시스템의 분석 모듈로 활용
- 한국어 대화 인터페이스의 모듈로 활용