ETRI-Knowledge Sharing Plaform

KOREAN
기술이전 검색
Year ~ Transaction Count Keyword

Detail

Audio Signal Dataset for Preprocessed Speech Emotion Recognition

Manager
Hoyoung Yoo
Participants
Kim Hyeon Jin, Hoyoung Yoo, Lee Sangeun, Chae Won Seok
Transaction Count
1
Year
2024
Project Code
24PT1300, Development of Responsive Digital Human for Youth Psychology Consulting Service, Kim Hyeon Jin
23PT1300, Development of Responsive Digital Human for Youth Psychology Consulting Service, Kim Hyeon Jin
22PT1300, Development of Responsive Digital Human for Youth Psychology Consulting Service, Kim Hyeon Jin
음성신호 전처리 기반 감성인식(음성의 내용과 문맥을 배제하고 오로지 음성 신호정보(높이, 세기 등)만을 활용한 감성인식) 기술개발을 위한 모델 학습데이터
- 사용자 반응형 환경·상황·감성 인지 기술을 개발하고 도메인에 적용함으로써, 교감형 상황인지 기술 분야 핵심기술 확보 및 국내외 기술선점 필요
- 감성인식 기술은 비언어 기반(음성, 표정, 행동)의 대화를 통해 심리를 파악하는데 유용한 기술로 국제적으로 더딘 상황으로 미개발 분야에 속함
- 감성인식 기술은 텍스트 기반, 표정기반, 음성신호기반의 세가지 종류로 분류가능하며, 이 중 하나의 모달리티만을 사용할 경우 정확성에 한계가 명확함
- 이 중 음성신호기반 감성인식분야는 표정 정보를 활용하지 못하는 환경에서의 활용도가 높고 멀티모달리티에서도 타 모달리티의 부족한 부분을 보충하는 중요한 정보로 활용되고 있으나, 다른 모달리티에 비하여 학습데이터 수가 적어 데이터의 중요성과 효용성이 더욱 높음
- 고도화된 감성기술을 응용한 개성 있는 가상의 인공지능 휴먼 에이전트 개발을 통해 인공지능 관련 분야의 신시장 선점 및 확산 기대
- 동양인, 특히 한국인 음성을 대상으로 구축되어 한국인의 음성 감성을 기존대비 정확하게 분석 가능
. 120명 이상의 중급이상 전문 성우를 선정하여 음성데이터 구축
. 3가지 분류(화난, 슬픔, 기쁨)로 감성을 표현한 발화 데이터를 10단계에 걸쳐 발화의 감성 강도를 태깅하여 세분화 함
- 음성신호기반 감성인식(음성의 내용과 문맥을 배제하고 오로지 음성 신호정보(높이, 세기 등)만을 활용한 감성인식) 기술개발을 위한 음성전처리 감성인식 모델 학습데이터
- 음성신호 전처리 기반 감성인식 모델 학습데이터
- 감정 인식, 의도 파악 등의 기술을 필요로 하는 교육, 의료, 공공복지, 산업분야에서 몰입감과 실재감을 높일 수 있는 감성 반응형 응용 서비스 기술로 활용 가능
. (사회복지) 사회적 소외계층, 청소년 상담 등 정서적 상담이 필요한 지원서비스
. (국방분야) 내무병사, 재향군인 등 군종사자의 불안도, 심리변화 추적 등 감성인지 서비스
. (산업지원) 고객분석, 면접자 신뢰도 평가 등 감성분석을 이용한 다양한 CS지원
. (교육분야) 학습자의 반응분석을 통한 상호작용이 가능한 지능형 교육에이전트
. (의료분야) 환자의 기분상태 모니터링, 우울증, 치매진단 등 인공지능 디지털헬스케어

- 영상 인식과 함께 활용되어 개인화 기반의 대화 감정, 표정 인식, 의도 파악 등의 기술 개발을 통해 몰입감과 실재감을 높일 수 있는 감성 반응형 응용시장 산업경쟁력 확보
- 인공지능 비서, 교육 등 다양한 분야의 제품에 도입해서 경제적 효과 유발
- 인간 감성 탐지 서비스의 요소로 포함되어 다양한 대인 기반 서비스 창출
- 실감 콘텐츠 친구, 상담 서비스, 교육 등 실생활과 밀접한 분야의 다양한 서비스 제공으로 실감 콘텐츠에 대한 사용자 만족도 증대 및 삶의 질 향상 추구
- 실생활 수준의 현장감, 공간감, 사실감 제공으로 몰입도, 효율성, 인지도 증대를 통한 전문가 서비스, 자율 주행, 범죄 및 사고 예방 서비스 제공