ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

특허 검색
구분 출원국
출원년도 ~ 키워드

상세정보

등록 n-gram 데이타 및 언어 분석에 기반한 문법 오류 교정 장치 및 방법

n-gram 데이타 및 언어 분석에 기반한 문법 오류 교정 장치 및 방법
이미지 확대
발명자
노윤형, 신종훈, 김영길, 서영애, 이기영, 김창현, 권오욱, 김운, 박은진, 나승훈, 정상근, 김강일, 황금하, 박상규, 최승권
출원번호
10-2014-0013464 (2014.02.06) KIPRIS
공개번호
10-2015-0092879 (2015.08.17)
등록번호
10-2026967-0000 (2019.09.24)
출원국
대한민국
협약과제
13VS1500, 모바일 플랫폼 기반 대화모델 적용 자연어 음성인터페이스 기술 개발, 이윤근
초록
n-gram 데이터를 이용한 통계적 기법 및 언어 분석 기법을 결합한 하이브리드 방식으로 문법 오류를 교정하는 장치 및 방법이 개시된다. 본 발명의 일 면에 따른 컴퓨터로 구현 가능한 n-gram 데이터 및 언어 분석에 기반한 문법 오류 교정방법은 입력된 문장에 대해 태깅 및 전처리를 수행하는 단계; 대량의 코퍼스(corpus)로부터 추출한 n-gram 통계 데이터를 이용하여 상기 태깅 및 전처리된 입력 문장에서 문법 오류 후보를 검출하는 단계; 상기 문법 오류 후보에 대해 유사 n-gram을 추출하고 유사도, 빈도, 문법적인 조건을 이용하여 최종 교정 n-gram을 선택하여 교정문을 생성하는 단계; 상기 교정문을 다시 입력 받아 오류 규칙을 적용한 구문분석을 수행하면서 구문 트리를 생성하고, 상기 구문 트리를 구성하는 각각의 노드에 노드 교정정보를 할당하는 단계; 및 상기 노드 교정정보를 이용하여 상기 교정문을 교정하는 단계를 포함한다.