ETRI-Knowledge Sharing Plaform

KOREAN
기술이전 검색
Year ~ Transaction Count Keyword

Detail

Technology of Converting Local Dialect into Standard

Manager
Kim Yongjun
Participants
Kim Yongjun, Bang Junseong
Transaction Count
4
Year
2022
Project Code
22IR1600, 대화형 치안 지식 서비스 폴봇 개발, Bang Junseong
21IR1800, 대화형 치안 지식 서비스 폴봇 개발, Bang Junseong
딥러닝 기술을 이용하여 지역 방언(강원, 충청, 경상, 전라, 제주) 텍스트를 표준어 텍스트로 변환시키는 기술
(1) 목적
- “대화형 치안 지식 서비스 폴봇 개발” 과제의 결과물이 적용될 182경찰민원콜센터 등과 같은 AICC(AI Contact Center)에서 지역 방언에 대해 이해도가 낮은 상담관이 민원을 처리에 어려움이 있어, STT(Speech-to-Text)로 통해 생성된 지역 방언 텍스트를 표준어로 텍스트로 변환하면, 상담관 업무에 도움이 될 수 있는 기술 수요가 발생하여 기술이전을 진행함

(2) 필요성
- 지역 방언이 사용되는 지역에 거주하지 않았거나, 지역 방언을 접할 기회가 적었던 상담관의 경우, 지역 방언으로 된 민원 내용을 이해하기 어려운 경우가 발생함
(1) 지역 방언 데이터를 통한 딥러닝 네트워크 기반의 모델 생성 기술
- Transformer 기반의 딥러닝 모델 생성 기 제공
- 필요 시, 기존 사전학습 모델에 미세 조정을 통해 새로운 학습 모델 생성 가능

(2) 서비스 도메인에 특화된 변환 모델 생성 기능 제공
- 특정 서비스 도메인에서만 사용되는 지역 방언에 대한 데이터를 획득 후, 학습을 통해 도메인에 특화된 딥러닝 모델 학습 기능 지원
(1) 기술명 : 지역 방언 표준어 변환 기술
- 언어dict 생성 기능
a. 지역 방언 텍스트에서 BPE(Byte Pair Encoding) 기반의 언어dict을 생성할 수 있는 기능

- 지역 방언 표준어 변환 모델 생성 기능
a. 기본 트랜스포머 기반 지역 방언 표준어 변환 모델 생성 기능
b. 사전 학습된 언어모델(예: BERT, BART 등)에 미세조정(Fine-Tunning)을 진행하여 확장된 변환 모델 생성 가능
c. 학습 환경에 맞춘 학습 파라미터 설정 가능(배치 사이즈, 버퍼 사이즈, 에폭 횟수 등)

- 지역 방언 표준어 대응 데이터
a. 국립국어원, AIHub의 지역 방언-표준어 매칭 데이터

- 학습된 모델 평가 기능
a. 학습된 변환 모델에 대한 BLEU 스코어 평가 기능 제공
(1) 기술명 : 기계학습 기반의 텍스트 요약 기술
- 기술 설명 문서
- 개발 소스코드
- 지역 방언-사투리 데이터
(1) 적용 분야
- (AICC 서비스 적용) 지역 방언을 사용할 수 있는 불특정 다수를 대상으로 서비스하는 AICC의 경우, 민원에 대해 정확하고, 빠른 응대를 제공할 필요가 있음. 지역 방언을 표준어로 변환하는 기술을 상담관이 처리하는 민원 서비스에 보조 기능으로 지원 및 제공 가능
- (회의록 작성) 특정 지역 방언이 자주 사용되는 기관/기업에서 해당 지역 방언에 대한 학습을 통해, 도메인에 특화된 서비스 적용 가능
- (공공 서비스 적용) 지역 방언을 주로 사용하는 고연령층에 대해 지역 방언에 해당하는 표준어를 안내하는 서비스에 적용 가능

(2) 기대효과
- (업무 생산성 증대) 지역 방언을 표준어로 변환하는 기술로 의미를 알 수 없었던 지역 방언의 뜻과 문맥을 빠르게 확인하고, 현장 적용하여 업무 생산성 증대가 기대됨
- (생활 편의성 향상) 지역 방언과 표준어를 사용하는 사람들 사이의 의사소통 및 상대방의 의도를 재확인하는 불필요한 행위가 줄어 생활 편의성 향상이 기대됨