Registered
병렬 말뭉치를 이용한 중국어 단어분리 성능 향상 방법 및 장치
- Inventors
-
김운, 정상근, 이기영, 김영길, 서영애, 김창현, 최승권, 권오욱, 노윤형, 신종훈, 황금하, 나승훈, 박은진, 박상규, 양성일
- Application No.
-
10-2012-0125764 (2012.11.08)
KIPRIS
- Publication No.
-
10-2014-0059877 (2014.05.19)
- Registration No.
- 10-1757237-0000 (2017.07.06)
- Country
- KOREA
- Project Code
-
12VS1500, Development of Original Software Technology for Automatic Speech Translation with Performance 90% for Tour/International Event focused on Multilingual,
Kim Young Kil
- Abstract
- 본 발명은 중국어 단어분리 성능 향상 방법 및 그 장치에 관한 것으로써, 보다 구체적으로는 중국어 단어분리기에 자주 나타나는 미등록어 오류와 모호성 오류를 줄이기 위해 중국어의 단어 분리 오류를 단어의 경계가 명확한 병렬 말뭉치의 타언어, 예를 들어 영어나 한국어 문장으로부터 그 단어의 정확한 경계를 자동 인식하여 처리함으로써 단어분리 성능을 개선하고자 하는 방법 및 장치에 관한 것이다. 본 발명에 의하여, 중국어 문장의 단어분리 시에 처리하기 힘든 미등록어 오류와 모호성 오류에 대하여 병렬 말뭉치를 통해 지속적으로 추출하고 정정된 단어분리 정보를 저장함으로써, 대량의 인력, 시간을 소모하여 단어분리 결과에서 오류를 확인하는 한계를 극복할 수 있다.
- KSP Keywords
- Chinese Word Segmentation, Parallel Corpus, Word segmentation, performance improvement