ETRI-Knowledge Sharing Plaform

KOREAN
기술이전 검색
Year ~ Transaction Count Keyword

Detail

Real-life acoustic events and scenes DB

Manager
Jeong Young Ho
Participants
Suh Sang Won, Lee Tae Jin, Lim Woo-Taek, Jeong Young Ho
Transaction Count
1
Year
2019
Project Code
18HS1800, Development of Human Enhancement Technology for auditory and muscle, Shin Hyung Cheol
17HS2300, Development of Human Enhancement Technology for auditory and muscle, Shin Hyung Cheol
‘실생활 음향 이벤트/장면 DB’는 실내외 환경에서 수집된 다양한 음향 이벤트/장면 신호 데이터 및 어노테이션 관련 메타데이터로 구성되며, 이를 음향 이벤트/장면 인식 모델의 학습 및 성능 평가를 위한 용도로 활용할 수 있음
O 통신미디어연구소 미디어연구본부 미디어부호화연구실에서는 "신체기능의 이상이나 저하를 극복하기 위한 휴먼 청각 및 근력 증강 원천 기술 개발” 사업의 일환으로 실생활 음향 이벤트/장면 인식 기술 개발을 위한 “휴먼 청각 증강 기술 개발” 과제를 수행하고 있음
- 신체기능의 이상이나 저하를 극복하기 위한 휴먼 청각 및 근력 증강 원천 기술 개발 (2017.01. ~ 2021.12.)

O 휴먼 청각 증강을 위한 음향 이벤트/장면 인식 기술 개발과 관련하여, 실생활 음향 이벤트/장면 데이터베이스는 딥러닝 기반 음향 이벤트/장면 인식 모델의 학습, 검증, 성능 평가 및 보완에 있어 매우 중요한 요소임

O 특히, 바이노럴 및 스테레오 녹음 방식, 음원 및 마이크의 이동성 여부 등의 다양한 조건하에 수집된 실생활 음향 데이터는 음향 이벤트/장면 인식 모델의 인식 성능 제고에 매우 유용함

O 본 기술이전 대상은 DB 구축을 위한 신호 녹음 및 어노테이션 처리에 상당한 시간과 비용이 소요되므로, 이를 보유하지 못한 관련 기업에 기술이전 함으로써 음향 인식 관련 시장의 조기 활성화를 도모하기 위한 것임
O 복수의 음향 신호 데이터 녹음 방식 지원
- 바이노럴 및 스테레오
O 다양한 음향 신호 데이터 수집 조건 반영
- 마이크의 고정 및 이동, 음향 이벤트의 고정 혹은 이동
O 음향 신호 데이터 일반화를 위한 다양한 녹음 환경 반영
- 상이한 녹음 장소 및 시간 등
<기술이전의 내용>
O 실생활 음향 이벤트/장면 DB
● 실생활 음향 이벤트 DB(1세부 기술)
● 실생활 음향 장면 DB(2세부 기술)

<기술이전의 범위>
O 실생활 음향 이벤트/장면 DB
● 실생활 음향 이벤트 DB(1세부 기술)
- 음향 이벤트 신호 데이터
* 주요 이벤트 클래스 개수 : 37 개
* 주요 이벤트 클래스 당 평균 인스턴스 개수 : 약 676 개
* 총 녹음 분량 : 1,715 분
- 음향 이벤트 메타데이터
● 실생활 음향 장면 DB(2세부 기술)
- 음향 장면 신호 데이터
* 장면 개수 : 14 개
* 총 녹음 분량 : 705분
- 음향 장면 메타데이터
O 실생활 음향 이벤트/장면 DB 요구사항 정의서, 시험절차 및 결과서
O 실생활 음향 이벤트/장면 DB 설명서
O 음향 이벤트/장면 인식 시스템