ETRI-Knowledge Sharing Plaform

ENGLISH
기술이전 검색
연도 ~ 이전수 키워드

상세정보

마이크 이동성 위주의 실생활 음향 이벤트장면 DB

전수책임자
정영호
참여자
박수영, 이태진, 임우택, 정영호
기술이전수
1
이전연도
2021
협약과제
19HS1800, 신체기능의 이상이나 저하를 극복하기 위한 휴먼 청각 및 근력 증강 원천 기술 개발, 신형철
20HH6200, [전문연구실] 기계를 위한 영상 부호화, 서정일
20HS1300, 신체기능의 이상이나 저하를 극복하기 위한 휴먼 청각 및 근력 증강 원천 기술 개발, 신형철
‘마이크 이동성 위주의 실생활 음향 이벤트/장면 DB’는 실내외 환경에서 수집된 다양한 음향 이벤트/장면 신호 데이터 및 어노테이션 관련 메타데이터로 구성되며, 이를 음향 이벤트/장면 인식 모델의 학습 및 성능 평가를 위한 용도로 활용할 수 있음
O 통신미디어연구소 미디어연구본부 미디어부호화연구실에서는 "신체기능의 이상이나 저하를 극복하기 위한 휴먼 청각 및 근력 증강 원천 기술 개발” 사업의 일환으로 실생활 음향 이벤트/장면 인식 기술 개발을 위한 “휴먼 청각 증강 기술 개발” 과제를 수행하고 있음
- 신체기능의 이상이나 저하를 극복하기 위한 휴먼 청각 및 근력 증강 원천 기술 개발 (2017.01. ~ 2021.12.)

O 휴먼 청각 증강을 위한 음향 이벤트/장면 인식 기술 개발과 관련하여, 실생활 음향 이벤트/장면 데이터베이스는 딥러닝 기반 음향 이벤트/장면 인식 모델의 학습, 검증, 성능 평가 및 보완에 있어 매우 중요한 요소임

O 특히, 마이크의 이동성 여부, 바이노럴 및 스테레오 녹음 방식 등의 다양한 조건하에 수집된 실생활 음향 데이터는 음향 이벤트/장면 인식 모델의 인식 성능 제고에 매우 유용함

O 본 기술이전 대상은 음향 DB 구축을 위한 신호 녹음 및 어노테이션 처리에 상당한 시간과 비용이 소요되므로, 이를 보유하지 못한 관련 기업에 기술이전 함으로써 음향 인식 관련 시장의 활성화를 도모하기 위한 것임
O 복수의 음향 신호 데이터 녹음 방식 지원
- 바이노럴 및 스테레오
O 다양한 음향 신호 데이터 수집 조건 반영
- 마이크의 이동 및 고정, 음향 이벤트의 이동 혹은 고정
O 음향 신호 데이터 일반화를 위한 다양한 녹음 환경 반영
- 상이한 녹음 장소 및 시간
O 마이크 이동성 위주의 실생활 음향 이벤트/장면 DB
● 실생활 음향 이벤트 DB
● 실생활 음향 장면 DB
O 마이크 이동성 위주의 실생활 음향 이벤트/장면 DB
● 실생활 음향 이벤트 DB
- 음향 이벤트 신호 데이터
* 주요 이벤트 클래스 종류 : 46 종
* 주요 이벤트 클래스 당 평균 인스턴스 개수 : 약 580 개
* 총 녹음 분량 : 1,753 분
- 음향 이벤트 메타데이터
● 실생활 음향 장면 DB
- 음향 장면 신호 데이터
* 총 장면 종류 : 20 종
* 총 녹음 분량 : 1,700분
- 음향 장면 메타데이터
O 마이크 이동성 위주의 실생활 음향 이벤트/장면 DB 요구사항 정의서, 시험절차 및 결과서
O 마이크 이동성 위주의 실생활 음향 이벤트/장면 DB 설명서
O 음향 이벤트/장면 인식 시스템