딥러닝 기술을 이용하여 지역 방언(강원, 충청, 경상, 전라, 제주) 텍스트를 표준어 텍스트로 변환시키는 기술
(1) 목적
- “대화형 치안 지식 서비스 폴봇 개발” 과제의 결과물이 적용될 182경찰민원콜센터 등과 같은 AICC(AI Contact Center)에서 지역 방언에 대해 이해도가 낮은 상담관이 민원을 처리에 어려움이 있어, STT(Speech-to-Text)로 통해 생성된 지역 방언 텍스트를 표준어로 텍스트로 변환하면, 상담관 업무에 도움이 될 수 있는 기술 수요가 발생하여 기술이전을 진행함
(2) 필요성
- 지역 방언이 사용되는 지역에 거주하지 않았거나, 지역 방언을 접할 기회가 적었던 상담관의 경우, 지역 방언으로 된 민원 내용을 이해하기 어려운 경우가 발생함
(1) 지역 방언 데이터를 통한 딥러닝 네트워크 기반의 모델 생성 기술
- Transformer 기반의 딥러닝 모델 생성 기 제공
- 필요 시, 기존 사전학습 모델에 미세 조정을 통해 새로운 학습 모델 생성 가능
(2) 서비스 도메인에 특화된 변환 모델 생성 기능 제공
- 특정 서비스 도메인에서만 사용되는 지역 방언에 대한 데이터를 획득 후, 학습을 통해 도메인에 특화된 딥러닝 모델 학습 기능 지원
(1) 기술명 : 지역 방언 표준어 변환 기술
- 언어dict 생성 기능
a. 지역 방언 텍스트에서 BPE(Byte Pair Encoding) 기반의 언어dict을 생성할 수 있는 기능
- 지역 방언 표준어 변환 모델 생성 기능
a. 기본 트랜스포머 기반 지역 방언 표준어 변환 모델 생성 기능
b. 사전 학습된 언어모델(예: BERT, BART 등)에 미세조정(Fine-Tunning)을 진행하여 확장된 변환 모델 생성 가능
c. 학습 환경에 맞춘 학습 파라미터 설정 가능(배치 사이즈, 버퍼 사이즈, 에폭 횟수 등)
- 지역 방언 표준어 대응 데이터
a. 국립국어원, AIHub의 지역 방언-표준어 매칭 데이터
- 학습된 모델 평가 기능
a. 학습된 변환 모델에 대한 BLEU 스코어 평가 기능 제공
(1) 기술명 : 기계학습 기반의 텍스트 요약 기술
- 기술 설명 문서
- 개발 소스코드
- 지역 방언-사투리 데이터
(1) 적용 분야
- (AICC 서비스 적용) 지역 방언을 사용할 수 있는 불특정 다수를 대상으로 서비스하는 AICC의 경우, 민원에 대해 정확하고, 빠른 응대를 제공할 필요가 있음. 지역 방언을 표준어로 변환하는 기술을 상담관이 처리하는 민원 서비스에 보조 기능으로 지원 및 제공 가능
- (회의록 작성) 특정 지역 방언이 자주 사용되는 기관/기업에서 해당 지역 방언에 대한 학습을 통해, 도메인에 특화된 서비스 적용 가능
- (공공 서비스 적용) 지역 방언을 주로 사용하는 고연령층에 대해 지역 방언에 해당하는 표준어를 안내하는 서비스에 적용 가능
(2) 기대효과
- (업무 생산성 증대) 지역 방언을 표준어로 변환하는 기술로 의미를 알 수 없었던 지역 방언의 뜻과 문맥을 빠르게 확인하고, 현장 적용하여 업무 생산성 증대가 기대됨
- (생활 편의성 향상) 지역 방언과 표준어를 사용하는 사람들 사이의 의사소통 및 상대방의 의도를 재확인하는 불필요한 행위가 줄어 생활 편의성 향상이 기대됨