- 본 기술은 한국어-한국수어의 번역 학습을 위한 학습 말뭉치 데이터의 제작하고, 한국어문장 수어영상을 입력하여 수어소기반 표제어 추론용 DB를 구축하는 기능을 포함한다.
- 본 기술은 세부기술1) 한국어-한국수어 병렬말뭉치 편집 기술 , 세부기술2) 수어소 기반 표제어 추론 DB 생성 및 편집 기술로 구성되어 있음
- 세부기술1) 한국어-한국수어 병렬말뭉치 편집기 기술은 한국어-한국수어의 번역 학습을 위한 학습말뭉치 데이터의 제작을 지원하는 소프트웨어 기술로 한국어 문장의 입력과 이에 대응하는 한국수어문장(복수의 수어표제단어 및 비수지 표지로 구성)을 편집하고 결과를 하나의 JSON 포맷 또는 Exel로 저장하는 기능 을 포함하고 있음
- 세부기술2) 수어소 기반 표제어 추론 DB 구축 및 편집 기술은 수어소기반 표제어 추론용 DB 제작을 지원하는 소프트웨어 기술로 한국어 문장 수어 영상을 입력받아 수어소기반 표제어 추론용 DB를 생성 및 편집하는 기능을 포함하고 있음
- 본 기술은 AI기반 수어 인식, 수어 번역 등의 기술 개발에 요구되는 기반 기술로, 수어기반의 번역, 교육, 상담 등 다양한 서비스 분야의 사업자 및 개발자가 수어영상에 대한 한국수어 표제어 DB 구축 및 말뭉치 주석 데이터 생성에 활용할 수 있도록 지원하는 것을 목적으로 함
- 수어도 한국어처럼 국가에서 인정한 대한민국 공용어이며(한국수화언어법, 2016), 청각장애인의 주요 의사소통 수단 인만큼 자유로운 수어를 통한 의사소통의 요구가 증대되고 있음
- 양방향 수어통역 서비스의 수어 표제어 인식 기술 분야에서는 AI 기술을 적용하기 위해서는 표제어 단위의 수어 빅데이터 영상이 필요함
- AI-Hub https://www.aihub.or.kr/
에서 공공 수어 AI 학습용 데이터를 제공하기는 하나, 국립국어원에서 제공하는 약 3,800개의 일상생활 수어 표제어를 학습하기에는 데이터가 부족한 실정임
- OTT, 통신사, 공공기관 등에서도 비대면 수어상담, 방송 자막, 수어챗봇 등의 서비스 상용화를 추진 중이나, 병렬 말뭉치 및 표제어 DB 부재로 인해 어려움이 있음
- 본 기술은 국립국어원의 한국수어문법 및 수어표기법에 준하여 한국수어문을 UI를 통하여 제작하고 편집하는 기능을 제공함
- 본 기술은 한국어 문장 수어 영상을 입력받아 수어소기반 표제어 추론용 DB를 생성 및 편집하는 기능을 제공함
- 세부기술1: 한국수어 말뭉치 편집 기술
. 한국수어 표제어 DB 인터페이스
. 한국수어 수어문 편집 UI
. 한국수어문 입출력(json, excel)
. 한국수어문 표제어 통계 분석
- 세부기술2: 수어소 기반 표제어 추론 DB 생성 및 편집 기술
. 한국어 문장 수어 영상 입력 인터페이스
. 수어소기반 표제어 추론용 DB(excel) 입출력
. 수어소기반 표제어 추론용 DB 생성 및 편집
- 세부기술1: 한국수어 말뭉치 편집 기술
● 한국수어 표제어 및 말뭉치 주석 데이터 생성 모듈 요구사항정의서 1종
● 한국수어 표제어 및 말뭉치 주석 데이터 생성 모듈 시험절차결과서 1종
● 한국수어 말뭉치 편집기 프로그램 (소스코드 및 바이너리 제공) 1종
- 세부기술2: 수어소 기반 표제어 추론 DB 생성 및 편집 기술
● 한국수어 표제어 및 말뭉치 주석 데이터 생성 모듈 요구사항정의서 1종
● 한국수어 표제어 및 말뭉치 주석 데이터 생성 모듈 시험절차결과서 1종
● 수어소 기반 표제어 추론 DB 생성 및 편집 프로그램(소스코드 및 바이너리 제공) 1종
- 한국어 ↔ 한국수어 양방향 번역 엔진 개발, 실시간 수어 아바타 생성, 자막 자동 변환 등을 필요로 하는 AI기반 수어 번역 서비스, 공공기관 민원상담, 병원·금융기관 등 접근성 강화를 위한 비대면 수어상담/콜 서비스에 적용
- 방송 콘텐츠의 수어 통역 자동화 및 AI 기반 수어 자막 생성이나, AI 수어 아바타 또는 수어 영상 동시 송출 시스템에 활용
- 의료·공공 안전 분야에서 응급의료, 재난 알림, 병원 접수 시스템 등에서 수어 기반 대화 인터페이스 구축 가능
- 수어 병렬말뭉치와 표제어 DB 구축에 있어서 수작업 대비 데이터 제작 효율 향상 기대
- 언어데이터 전문기업, 스타트업, SI업체 등에서 수어 데이터 구축·유통 사업화를 통한 한국어 ↔ 한국수어 변환을 위한 데이터 구축 시장의 새로운 수익모델 창출 기대