가. 기술이전의 내용
(1) 기술명 : 기계학습 기반의 텍스트 요약 기술
- 텍스트 전처리 기능
? 학습에 사용한 텍스트에 대해 불필요한 단어, 특수기호 등을 다른 텍스트로 전환 또는 삭제하는 기능
? 불용어 삭제 기능
? 정규표현식에 따른 텍스트 전처리 기능
- 언어모델 생성 기능
? 도메인 특화된 텍스트에서 BPE(Byte Pair Encoding) 기반의 언어모델을 생성할 수 있는 기능
? BPE 기반의 언어모델 생성 및 vocab size 설정 기능
- 추상 텍스트 요약 모델 생성 기능 (트랜스포머 기반)
? 기본 트랜스포머 기반 추상 텍스트 요약 모델 생성 기능
? 트랜스포머 모델 학습에 필요한 주요 수치 설정 기능(모델 차원, 레이어 개수 등)
? 학습 환경에 맞춘 학습 파라미터 설정 기능 (배치 사이즈, 버퍼 사이즈, 에폭 횟수 등)
- 한국어 어순에 특화된 추상 텍스트 요약 모델 생성 기능 (트랜스포머 기반)
? 어순이 불명확한 한국어의 특징을 반영할 수 있는 개선된 트랜스포머 추상 텍스트 요약 모델 생성 기능
? 트랜스포머 모델 학습에 필요한 주요 수치 설정 기능(모델 차원, 레이어 개수 등)
? 한국어 어순을 반영한 인코더에 필요한 주요 수치 설정 기능 (인코더 개수 등)
? 학습 환경에 맞춘 학습 파라미터 설정 기능 (배치 사이즈, 버퍼 사이즈, 에폭 횟수 등)
- 학습된 모델 로딩 및 학습 결과 평가 기능
? 학습된 추상 텍스트 요약 모델의 가중치 로드 기능
? ROUGE 기반의 학습 결과 평가 수치화 기능
나. 기술이전의 범위
(1) 기술명 : 기계학습 기반의 텍스트 요약 기술
- 기술 설명 문서
- 개발 소스코드