Registered
Language Correction Apparatus and Method based on n-gram data and linguistic analysis
- Inventors
-
Roh Yoon-Hyung, Sang Keun Jung, Kim Young Kil, Young-Ae Seo, Kim Chang Hyun, Choi Sung Kwon, Kwon Oh Woog, Jong Hun Shin, Huang Jinxia, Jin Yun, Seung-Hoon Na, Kangil Kim, Park Eun Jin, Park Sang Kyu, Lee Ki Young
- Application No.
-
10-2014-0013464 (2014.02.06)
KIPRIS
- Publication No.
-
10-2015-0092879 (2015.08.17)
- Registration No.
- 10-2026967-0000 (2019.09.24)
- Country
- KOREA
- Project Code
-
13VS1500, Development of dialog-based spontaneous speech interface technology on mobile platform,
Lee Yunkeun
- Abstract
- n-gram 데이터를 이용한 통계적 기법 및 언어 분석 기법을 결합한 하이브리드 방식으로 문법 오류를 교정하는 장치 및 방법이 개시된다. 본 발명의 일 면에 따른 컴퓨터로 구현 가능한 n-gram 데이터 및 언어 분석에 기반한 문법 오류 교정방법은 입력된 문장에 대해 태깅 및 전처리를 수행하는 단계; 대량의 코퍼스(corpus)로부터 추출한 n-gram 통계 데이터를 이용하여 상기 태깅 및 전처리된 입력 문장에서 문법 오류 후보를 검출하는 단계; 상기 문법 오류 후보에 대해 유사 n-gram을 추출하고 유사도, 빈도, 문법적인 조건을 이용하여 최종 교정 n-gram을 선택하여 교정문을 생성하는 단계; 상기 교정문을 다시 입력 받아 오류 규칙을 적용한 구문분석을 수행하면서 구문 트리를 생성하고, 상기 구문 트리를 구성하는 각각의 노드에 노드 교정정보를 할당하는 단계; 및 상기 노드 교정정보를 이용하여 상기 교정문을 교정하는 단계를 포함한다.
- KSP Keywords
- linguistic analysis, n-Gram