ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

특허 검색
구분 출원국
출원년도 ~ 키워드

상세정보

등록 병렬 말뭉치를 이용한 중국어 단어분리 성능 향상 방법 및 장치

병렬 말뭉치를 이용한 중국어 단어분리 성능 향상 방법 및 장치
이미지 확대
발명자
김운, 신종훈, 김영길, 서영애, 노윤형, 양성일, 이기영, 김창현, 권오욱, 박은진, 나승훈, 정상근, 황금하, 박상규, 최승권
출원번호
10-2012-0125764 (2012.11.08) KIPRIS
공개번호
10-2014-0059877 (2014.05.19)
등록번호
10-1757237-0000 (2017.07.06)
출원국
대한민국
협약과제
초록
본 발명은 중국어 단어분리 성능 향상 방법 및 그 장치에 관한 것으로써, 보다 구체적으로는 중국어 단어분리기에 자주 나타나는 미등록어 오류와 모호성 오류를 줄이기 위해 중국어의 단어 분리 오류를 단어의 경계가 명확한 병렬 말뭉치의 타언어, 예를 들어 영어나 한국어 문장으로부터 그 단어의 정확한 경계를 자동 인식하여 처리함으로써 단어분리 성능을 개선하고자 하는 방법 및 장치에 관한 것이다. 본 발명에 의하여, 중국어 문장의 단어분리 시에 처리하기 힘든 미등록어 오류와 모호성 오류에 대하여 병렬 말뭉치를 통해 지속적으로 추출하고 정정된 단어분리 정보를 저장함으로써, 대량의 인력, 시간을 소모하여 단어분리 결과에서 오류를 확인하는 한계를 극복할 수 있다.
KSP 제안 키워드
Chinese Word Segmentation, Parallel Corpus, Word segmentation, performance improvement