ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

특허 검색
구분 출원국
출원년도 ~ 키워드

상세정보

등록 신경망 기계번역 방법 및 장치

신경망 기계번역 방법 및 장치
이미지 확대
발명자
신종훈, 김영길
출원번호
10-2017-0140232 (2017.10.26) KIPRIS
공개번호
10-2019-0046432 (2019.05.07)
등록번호
10-2069692-0000 (2020.01.17)
출원국
대한민국
협약과제
17HS1700, 지식증강형 실시간 동시통역 원천기술 개발, 김영길
초록
본 발명은, 부분어휘 토큰을 훼손하지 않으면서 명시적인 어휘정렬 정보가 부가된 학습데이터 생성 방법 및 이를 포함하는 신경망 기계번역 방법 및 장치를 제안한다. 학습데이터 생성 방법은 (1) 학습에 사용될 이중언어 말뭉치의 문장으로부터 형태소 분석 또는 개체명 인식 단계를 통한 기본 어휘 경계를 분리하는 단계; (2) 학습에 사용될 이중언어 말뭉치의 문장으로부터 명시적 어휘정렬 정보를 추출하는 단계; (3) 단계 1에 의해 분리된 어휘 경계를 다시 부분어휘 토큰으로 분리하는 단계; (4) 단계 1에 의해 처리된 원문언어 결과물과, 단계 3에 의해 처리된 원문언어 결과물을 사용하여, 새로운 원문언어 학습데이터를 생성하는 단계; (5) 단계 2에서 생성된 명시적 어휘정렬 정보와, 단계 1 및 3에 의해 처리된 대역언어 결과물을 사용하여, 새로운 대역언어 학습데이터를 생성하는 단계를 포함한다.