ETRI-Knowledge Sharing Plaform

KOREAN
논문 검색
Type SCI
Year ~ Keyword

Detail

Journal Article 실생활 음향 데이터 기반 이중 CNN 구조를 특징으로 하는 음향 이벤트 인식 알고리즘
Cited - time in scopus Download 102 time Share share facebook twitter linkedin kakaostory
Authors
서상원, 임우택, 정영호, 이태진, 김휘용
Issue Date
2018-11
Citation
방송공학회논문지, v.23, no.6, pp.855-865
ISSN
1226-7953
Publisher
한국방송공학회 (KOSBE)
Language
Korean
Type
Journal Article
DOI
https://dx.doi.org/10.5909/JBE.2018.23.6.855
Project Code
18HS1800, Development of Human Enhancement Technology for auditory and muscle, Shin Hyung Cheol
Abstract
음향 이벤트 인식은 다수의 음향 이벤트가 발생하는 환경에서 이를 인식하고 각각의 발생과 소멸 시점을 판단하는 기술로써 인간의 청각적 인지 특성을 모델화하는 연구다. 음향 장면 및 이벤트 인식 연구 그룹인 DCASE는 연구자들의 참여 유도와 더불어 음향 인식 연구의 활성화를 위해 챌린지를 진행하고 있다. 그러나 DCASE 챌린지에서 제공하는 데이터 세트는 이미지 인식 분야의 대표적인 데이터 세트인 이미지넷에 비해 상대적으로 작은 규모이며, 이 외에 공개된 음향 데이터 세트는 많지 않아 알고리즘 개발에 어려움이 있다. 본 연구에서는 음향 이벤트 인식 기술 개발을 위해 실내외에서 발생할 수 있는 이벤트를 정의하고 수집을 진행하였으며, 보다 큰 규모의 데이터 세트를 확보하였다. 또한, 인식 성능 개선을 위해 음향 이벤트 존재 여부를 판단하는 보조 신경망을 추가한 이중 CNN 구조의 알고리즘을 개발하였고, 2016년과 2017년의 DCASE 챌린지 기준 시스템과 성능 비교 실험을 진행하였다.
This work is distributed under the term of Creative Commons License (CCL)
(CC BY NC ND)
CC BY NC ND