본 이전기술은, 한국어 구어체 문장에 대해 간투사, 도치, 문장부호 누락, 철자 오류 현상 처리 및 문두 단어 처리 등을 수행함.
- 본 이전기술의 목적은 한국어 구어체 문장에 대해 자동번역이 어려운 문장을 자동번역이 용이한 형태로 바꾸어 주는 형태소 분석 기반 전처리기를 제공하는 것임
- 한국의 경제, 과학기술을 비롯한 전체적인 발전과 더불어 한류의 확대 등으로 한국어 구어체에 대한 자동번역 기술의 요구가 급격히 증가하고 있으며, 이에 따라 한국어 구어체에 많이 나타나지만 이로 인해 번역이 어려워지는 간투사, 도치, 문장부호 누락, 철자 오류 현상 처리 및 문두 단어 처리 등에 대한 기술이 요구됨.
본 이전기술은, 한국어 구어체 문장에 대해 간투사, 도치, 문장부호 누락, 철자 오류 현상 처리 및 문두 단어 처리 등을 수행함으로써 자동번역이 쉽지 않은 문장을 자동번역이 용이한 형태로 바꾸어 줄 수 있다.
이를 통해, 기존에는 구어체의 어려운 현상들을 해결함으로써 여러 응용 분야의 결과물을 더욱 개선시킬 수 있게 된다. 예를 들어 자동번역에서와 같이 처리가 어려워 번역이 쉽지 않았던 구어체 문장들에 대해 더 우수한 번역 결과를 제공할 수 있다.
- 한국어 전처리 엔진 라이브러리
- 기계학습 기반 한국어 형태소 분석 엔진 라이브러리
- 기계학습 기반 한국어 형태소 분석 지식
- 한국어 전처리 엔진 라이브러리
: 한국어 간투사, 도치, 문장부호 누락, 철자 오류 현상 처리 및 문두 단어 처리를 수행하는 전처리 엔진 라이브러리 및 API (Windows용 및 Linux용)
- 기계학습 기반 한국어 형태소 분석 엔진 라이브러리
: 한국어 구어체 문장에 대해 형태소 분석을 수행하는 엔진 라이브러리 및 API (Windows용 및 Linux용)
- 기계학습 기반 한국어 형태소 분석 지식
: 기계학습 기반 한국어 형태소 분석기를 위한 학습 사전
- 한국어 구어체 정보검색, 구문분석 등 한국어 자연어 처리 응용분야에 사용
- 한국어 관련 자동번역 및 통역 시스템의 분석 모듈로 활용
- 한국어 대화 인터페이스의 모듈로 활용