딥러닝 기반으로 한국어 문장을 한국수어 문장으로 번역하는 소프트웨어 구현
1) 기술이전의 목적
■ 청각장애인을 위해 모든 미디어에 대한 수어 서비스를 제공할 수 있는 소프트웨어 상용화 추진
■ 해당 청각장애인용 콘텐츠 제작에 필요한 소프트웨어 기술 전수를 통한 방송사업자의 자체 시스템 적용 및 청각장애인 대상 콘텐츠 확대 적용
2) 기술이전의 필요성
■ 국내에서는 2012년부터 “장애인방송 편성 및 제공 등 장애인 방송접근권 보장에 관한 고시”를 통하여 방송사업자의 방송시간 중 청각장애인을 주요 수요자로 하는 수어방송은 5% 제작 편성하도록 되어 있음
■ 방송에서는 의무방송분량으로 인해 전문 수어통역사를 통해 어느 정도 서비스가 이루어지고 있으나, 방송시청환경의 변화에 따라 가입자가 급증하고 있는 VOD, OTT에 있어서는 청각장애인이 접근할 수 있는 콘텐츠가 매우 부족한 상황임
■ 청각장애인은 자막 및 수어에 의존하기 때문에 음성로 제공되는 정보를 텍스트 또는 수어로 변환하여 제공할 수 있는 서비스가 반드시 필요하며, 경제적 비용을 절감하면서 콘텐츠를 용이하게 제작할 수 있는 수단이 필요함
■ 청각장애인용 콘텐츠를 양적으로 확대하기 위해서는 자동적으로 음성을 자막으로 변환하는 기술과 생성된 자막을 수어로 변환하여 수어로 발화하는 기술이 포함된 번역 소트프웨어가 요구됨
실시간으로 한국어 문장을 입력받아 한국수어 문장로 변환
- 청각장애인이 미디어에 대한 이해를 돕는 아바타수어 콘텐츠 표현용 정보(수어스크립트) 생성
- 약 3만문장의 학습데이터를 기반으로 모델 생성(BLEU >22.0)
- 일상생활중심의 한국수어 학습모델 제공
1. 세부 기술명 : 한국어-한국수어 변환시스템 SW
- 한국어 문장을 한국수어 문장으로 변환할 수 있는 학습모델
- 아바타수어 발화를 위한 수어스크립트 생성 기술
- 웹소켓 기반 수어스크립트 송수신 기술
2. 세부 기술명 : 한국어-한국수어 병렬말뭉치 데이터
- 장르: 일상생활 중심의 드라마
- 한국수어 표제어 Gloss: 2020년 기준 국립국어원 온라인 수어사전(=표제어 + origin_no) 참조
- 주요 문장에 대한 수어영상 포함
1. 세부 기술명 : 한국어-한국수어 변환시스템 SW
- 관련 기술문서(TDP 및 TM)
. 요구사항 정의서
. 시험절차 및 결과서
. 공인시험확인서
- 소프트웨어
. 변환 학습모델 학습 및 테스트 SW
. 실시간 변환서비스용 SW
2. 세부 기술명 : 한국어-한국수어 병렬말뭉치 데이터
- 관련 기술문서(TDP 및 TM)
. 한국어-한국수어 병렬말뭉치 제작 가이드라인
- 한국어-한국수어 병렬말뭉치 데이터
. 한국어-한국수어 문장 개수: 97,509개 (한국어 문장 중복 포함)
. 한국어-한국수어-수어영상 개수: 26,959 문장
■ 청작장애인을 대상으로 하는 수어방송 콘텐츠나 텍스트를 아바타수어로 표현하는 미디어 콘텐츠 제작에 활용
■ 장애인방송 콘텐츠의 내실 있는 양적확대를 통해 청각장애인의 디지털 정보격차를 해소