ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

특허 검색
구분 출원국
출원년도 ~ 키워드

상세정보

등록 음절 다중 조합 키워드 기반 문형 자동 분류 방법

음절 다중 조합 키워드 기반 문형 자동 분류 방법
이미지 확대
발명자
이수종, 김상훈, 김정세, 윤승
출원번호
10-2015-0027285 (2015.02.26) KIPRIS
공개번호
10-2016-0104371 (2016.09.05)
등록번호
10-1763329-0000 (2017.07.25)
출원국
대한민국
협약과제
14ZS1100, 언어장벽 없는 국가 구현을 위한 자동통번역 산업 경쟁력 강화 사업, 김상훈
초록
본 발명은 서로 다른 언어를 사용하는 사람들 간의 의사소통을 위한 자동통역 과정에서, 음성인식 및 자동번역 텍스트를 분석하여 텍스트를 구성하는 모든 음절의 다중조합을 기반으로 단문이나 복합의미를 갖는 장문의 문형을 자동분류하고 문형부호를 부가하는 음절 다중 조합 키워드 기반 문형 자동 분류 방법에 관한 것으로, 상기 방법은, 복수의 학습 코퍼스를 대상으로 학습 코퍼스 별로 문형 별 키워드 후보를 추출하는 단계; 추출된 각각의 키워드 후보의 상대 빈도율을 계산하는 단계; 상기 계산된 상대 빈도율과 기 설정된 임계값을 비교하여 그 결과에 따라 문형별 키워드로 선별하는 단계; 기 설정된 기준 음절수에 따라 입력되는 문장에 대한 각각의 음절을 다중조합하는 단계 ; 및 상기 조합된 음절과 상기 선별한 문형별 키워드를 비교하여 해당 문장의 문형을 분류하고 분류된 문형에 따른 문형 부호를 부가하는 단계를 포함한다.