ETRI-Knowledge Sharing Plaform

KOREAN
기술이전 검색
Year ~ Transaction Count Keyword

Detail

music-dialog signal separation technology in broadcast audio

Manager
Park Jee Hyun
Participants
Kim Jung-Hyun, Kim Hye-Mi, Park Jee Hyun, Seo Yong-Seok, Yoo Wonyoung, Im Dong-Hyuck
Transaction Count
2
Year
2022
Project Code
22IH2300, Development of high-speed music search technology using deep learning, Park Jee Hyun
21IH3400, Development of high-speed music search technology using deep learning, Park Jee Hyun
19KS1100, Intelligent Micro-Identification Technology for Music and Video Monitoring, Park Jee Hyun
방송 오디오에서 배경음악 식별 성능 향상을 위하여 배경음악과 출연자의 대사 신호를 분리하는 음원 분리 기술
- 오디오 핑거프린팅 기술은 음악으로부터 사람의 지문과 같은 고유의 특성을 추출하여 음악을 식별하는 기술임
- 커피 전문점이나 쇼핑몰과 같이 사람들이 웅성거리는 잡음 환경이나 자동차 내부에서 엔진 소리가 들리는 백색 잡음 환경에서는 비교적 우수한 성능을 나타냄
- TV에서 방영되는 드라마 등 방송물의 경우 배우가 대사를 하고 있을 때 배경으로 나오는 음악은 배우의 대사보다 소리의 크기가 훨씬 작고 대사가 무척 또렷하여 음악 식별 성능이 현저히 떨어짐
- 작은 소리로 혼합된 배경 음악의 식별 성능을 개선하기 위하여 음악과 대사가 혼합된 입력 신호로부터 음악과 대사를 분리한 후 대사가 제거된 신호를 이용해 배경 음악을 식별한다면 식별 성능을 높일 수 있음
- 음원 분리 기술은 서로 다른 신호가 혼합되었을 때 각각의 음원으로 분리하는 기술로 음악에서 악기별로 신호를 분리하거나 여러 화자의 목소리를 분리하는 기술이 활발히 연구되고 있음
- 이러한 음원 분리 기법을 음악과 대사를 분리하는 데 적용하여 대사가 제거된 신호로 배경음악을 식별하는 데 해당 기술을 활용할 수 있음
- 방송 오디오에서 배경음악이 아닌 대사 제거 기능
- 배경음악 트랙, 대사 트랙 각각 저장 가능
- 음원 분리 성능(SDR) : 10.1 (자체 제작된 ETRIMuSpDB 0dB기준)
<기술이전 내용>
- 방송 오디오 내 음악-대사 신호 분리 기술

<기술이전 범위>
- 방송 오디오 내 음악-대사 신호 분리 시스템 요구사항 정의서
- 방송 오디오 내 음악-대사 신호 분리 기술 시험 절차 및 결과서
- 방송 오디오 내 음악-대사 신호 분리 프로그램
- 기술 설명서
ㅇ 적용분야
- 방송 배경음악 검색 및 모니터링 시스템
- 모바일 음악검색 서비스
- 방송 음량 조정 시스템

ㅇ 기대효과
- 방송음악 저작권료 산정을 위한 선진화된 기술적 수단 제공
- 배경음악 검색 및 추천을 통한 관련 시장 확대와 한류 콘텐츠의 저작권료 수익 확대
- 라이브러리 음악의 손쉬운 사용으로 일반 사용자의 시장 참여 확대