ETRI-Knowledge Sharing Plaform

KOREAN
기술이전 검색
Year ~ Transaction Count Keyword

Detail

Real-life acoustic events and scenes DB collected mostly from microphone movement

Manager
Jeong Young Ho
Participants
Park Soo Young, Lee Tae Jin, Lim Woo-Taek, Jeong Young Ho
Transaction Count
1
Year
2021
Project Code
20HH6200, Video Coding for Machine, Jeongil Seo
20HS1300, Development of Human Enhancement Technology for auditory and muscle, Shin Hyung Cheol
19HS1800, Development of Human Enhancement Technology for auditory and muscle, Shin Hyung Cheol
‘마이크 이동성 위주의 실생활 음향 이벤트/장면 DB’는 실내외 환경에서 수집된 다양한 음향 이벤트/장면 신호 데이터 및 어노테이션 관련 메타데이터로 구성되며, 이를 음향 이벤트/장면 인식 모델의 학습 및 성능 평가를 위한 용도로 활용할 수 있음
O 통신미디어연구소 미디어연구본부 미디어부호화연구실에서는 "신체기능의 이상이나 저하를 극복하기 위한 휴먼 청각 및 근력 증강 원천 기술 개발” 사업의 일환으로 실생활 음향 이벤트/장면 인식 기술 개발을 위한 “휴먼 청각 증강 기술 개발” 과제를 수행하고 있음
- 신체기능의 이상이나 저하를 극복하기 위한 휴먼 청각 및 근력 증강 원천 기술 개발 (2017.01. ~ 2021.12.)

O 휴먼 청각 증강을 위한 음향 이벤트/장면 인식 기술 개발과 관련하여, 실생활 음향 이벤트/장면 데이터베이스는 딥러닝 기반 음향 이벤트/장면 인식 모델의 학습, 검증, 성능 평가 및 보완에 있어 매우 중요한 요소임

O 특히, 마이크의 이동성 여부, 바이노럴 및 스테레오 녹음 방식 등의 다양한 조건하에 수집된 실생활 음향 데이터는 음향 이벤트/장면 인식 모델의 인식 성능 제고에 매우 유용함

O 본 기술이전 대상은 음향 DB 구축을 위한 신호 녹음 및 어노테이션 처리에 상당한 시간과 비용이 소요되므로, 이를 보유하지 못한 관련 기업에 기술이전 함으로써 음향 인식 관련 시장의 활성화를 도모하기 위한 것임
O 복수의 음향 신호 데이터 녹음 방식 지원
- 바이노럴 및 스테레오
O 다양한 음향 신호 데이터 수집 조건 반영
- 마이크의 이동 및 고정, 음향 이벤트의 이동 혹은 고정
O 음향 신호 데이터 일반화를 위한 다양한 녹음 환경 반영
- 상이한 녹음 장소 및 시간
O 마이크 이동성 위주의 실생활 음향 이벤트/장면 DB
● 실생활 음향 이벤트 DB
● 실생활 음향 장면 DB
O 마이크 이동성 위주의 실생활 음향 이벤트/장면 DB
● 실생활 음향 이벤트 DB
- 음향 이벤트 신호 데이터
* 주요 이벤트 클래스 종류 : 46 종
* 주요 이벤트 클래스 당 평균 인스턴스 개수 : 약 580 개
* 총 녹음 분량 : 1,753 분
- 음향 이벤트 메타데이터
● 실생활 음향 장면 DB
- 음향 장면 신호 데이터
* 총 장면 종류 : 20 종
* 총 녹음 분량 : 1,700분
- 음향 장면 메타데이터
O 마이크 이동성 위주의 실생활 음향 이벤트/장면 DB 요구사항 정의서, 시험절차 및 결과서
O 마이크 이동성 위주의 실생활 음향 이벤트/장면 DB 설명서
O 음향 이벤트/장면 인식 시스템