ETRI-Knowledge Sharing Plaform

ENGLISH
기술이전 검색
연도 ~ 이전수 키워드

상세정보

방송 오디오 내 음악-대사 신호 분리 기술

전수책임자
박지현
참여자
김정현, 김혜미, 박지현, 서용석, 유원영, 임동혁
기술이전수
1
이전연도
2022
협약과제
19KS1100, 음악 및 동영상 모니터링을 위한 지능형 마이크로 식별 기술 개발, 박지현
21IH3400, 딥러닝을 활용한 고속 음악 탐색 기술 개발, 박지현
22IH2300, 딥러닝을 활용한 고속 음악 탐색 기술 개발, 박지현
방송 오디오에서 배경음악 식별 성능 향상을 위하여 배경음악과 출연자의 대사 신호를 분리하는 음원 분리 기술
- 오디오 핑거프린팅 기술은 음악으로부터 사람의 지문과 같은 고유의 특성을 추출하여 음악을 식별하는 기술임
- 커피 전문점이나 쇼핑몰과 같이 사람들이 웅성거리는 잡음 환경이나 자동차 내부에서 엔진 소리가 들리는 백색 잡음 환경에서는 비교적 우수한 성능을 나타냄
- TV에서 방영되는 드라마 등 방송물의 경우 배우가 대사를 하고 있을 때 배경으로 나오는 음악은 배우의 대사보다 소리의 크기가 훨씬 작고 대사가 무척 또렷하여 음악 식별 성능이 현저히 떨어짐
- 작은 소리로 혼합된 배경 음악의 식별 성능을 개선하기 위하여 음악과 대사가 혼합된 입력 신호로부터 음악과 대사를 분리한 후 대사가 제거된 신호를 이용해 배경 음악을 식별한다면 식별 성능을 높일 수 있음
- 음원 분리 기술은 서로 다른 신호가 혼합되었을 때 각각의 음원으로 분리하는 기술로 음악에서 악기별로 신호를 분리하거나 여러 화자의 목소리를 분리하는 기술이 활발히 연구되고 있음
- 이러한 음원 분리 기법을 음악과 대사를 분리하는 데 적용하여 대사가 제거된 신호로 배경음악을 식별하는 데 해당 기술을 활용할 수 있음
- 방송 오디오에서 배경음악이 아닌 대사 제거 기능
- 배경음악 트랙, 대사 트랙 각각 저장 가능
- 음원 분리 성능(SDR) : 10.1 (자체 제작된 ETRIMuSpDB 0dB기준)
<기술이전 내용>
- 방송 오디오 내 음악-대사 신호 분리 기술

<기술이전 범위>
- 방송 오디오 내 음악-대사 신호 분리 시스템 요구사항 정의서
- 방송 오디오 내 음악-대사 신호 분리 기술 시험 절차 및 결과서
- 방송 오디오 내 음악-대사 신호 분리 프로그램
- 기술 설명서
ㅇ 적용분야
- 방송 배경음악 검색 및 모니터링 시스템
- 모바일 음악검색 서비스
- 방송 음량 조정 시스템

ㅇ 기대효과
- 방송음악 저작권료 산정을 위한 선진화된 기술적 수단 제공
- 배경음악 검색 및 추천을 통한 관련 시장 확대와 한류 콘텐츠의 저작권료 수익 확대
- 라이브러리 음악의 손쉬운 사용으로 일반 사용자의 시장 참여 확대