Registered
Neural machine translation method and apparatus
- Inventors
-
Jong Hun Shin, Kim Young Kil
- Application No.
-
10-2017-0140232 (2017.10.26)
KIPRIS
- Publication No.
-
10-2019-0046432 (2019.05.07)
- Registration No.
- 10-2069692-0000 (2020.01.17)
- Country
- KOREA
- Project Code
-
17HS1700, Core technology development of the real-time simultaneous speech translation based on knowledge enhancement,
Kim Young Kil
- Abstract
- 본 발명은, 부분어휘 토큰을 훼손하지 않으면서 명시적인 어휘정렬 정보가 부가된 학습데이터 생성 방법 및 이를 포함하는 신경망 기계번역 방법 및 장치를 제안한다. 학습데이터 생성 방법은 (1) 학습에 사용될 이중언어 말뭉치의 문장으로부터 형태소 분석 또는 개체명 인식 단계를 통한 기본 어휘 경계를 분리하는 단계; (2) 학습에 사용될 이중언어 말뭉치의 문장으로부터 명시적 어휘정렬 정보를 추출하는 단계; (3) 단계 1에 의해 분리된 어휘 경계를 다시 부분어휘 토큰으로 분리하는 단계; (4) 단계 1에 의해 처리된 원문언어 결과물과, 단계 3에 의해 처리된 원문언어 결과물을 사용하여, 새로운 원문언어 학습데이터를 생성하는 단계; (5) 단계 2에서 생성된 명시적 어휘정렬 정보와, 단계 1 및 3에 의해 처리된 대역언어 결과물을 사용하여, 새로운 대역언어 학습데이터를 생성하는 단계를 포함한다.
- KSP Keywords
- Machine Translation(MT), Neural machine translation