음악요약이란 주어진 음악 컨텐츠에서 가장 중요하고 특징적인 한 부분이나 여러 부분들을 제공하는 것을 말한다. 음악요약 기술에는 크게 두 가지 종류의 음악요약을 위한 기술들이 연구되고 있다. 음악 컨텐츠내에서 반복되는 구간을 음악요약으로 제공하는 기술과 특징이 다른 부분들의 일정구간을 모두 제공하는 기술이 있다. 본 논문에서는 두 가지 종류의 음악요약을 제공하는 알고리즘들을 제안하고 평가하였다. 반복되는 구간을 음악요약으로 제공하는 다중 레벨 벡터양자화를 이용한 알고리즘은 고정된 길이와 최적의 길이를 가지는 음악요약을 제공하는 알고리즘들을 객관적인 방법으로 성능을 평가 하였고, 음악 내에서 특징이 다른 부분들을 일정부분씩 취합하여 제공하는 2-D 유사도행렬과 k-mean 알고리즘을 이용하는 집단화 방법을 이용한 방법의 평가는 주관적인 평가인 MOS 테스트로 평가하였다. 다중 레벨 벡터양자화를 이용한 음악요약을 제공하는 알고리즘에서 고정된 길이의 음악요약을 제공하는 알고리즘은 사람이 직접 요약한 결과와 제안한 방법으로 구한 요약과의 중첩도(Overlapping Ratio)를 이용한 결과 기존의 방법들이 42.2%와 47.3%임에 비해 제안된 방법은 67.1%로 높은 성능을 보여주었고, 최적의 길이를 가지는 음악요약을 제공하는 알고리즘은 음악에 따라 다른 길이를 가지는 반복되는 부분의 포함 정도를 나타내는 최적 중첩비율(Optimal Overlapping Ratio)을 측정한 결과 고정된 길이를 가지는 음악요약 보다 최적의 길이로 음악마다 다른 길이의 반복되는 부분을 효과적으로 표현함을 알 수 있었다. 집단화 방법을 이용한 알고리즘은 두 가지 질문들(제공된 세그먼트들 중 특징이 비슷한 것의 개수, 제공된 세그먼트들 중 같은 구조에 속하는 것의 개수)을 이용한 MOS 테스트에서 우수한 결과를 보여주었다.
KSP 제안 키워드
k-Means, overlapping ratio, two-dimensional(2D)
저작권정책 안내문
한국전자동신연구원 지식공유플랫폼 저작권정책
한국전자통신연구원 지식공유플랫폼에서 제공하는 모든 저작물(각종 연구과제, 성과물 등)은 저작권법에 의하여 보호받는 저작물로 무단복제 및 배포를 원칙적으로 금하고 있습니다. 저작물을 이용 또는 변경하고자 할 때는 다음 사항을 참고하시기 바랍니다.
저작권법 제24조의2에 따라 한국전자통신연구원에서 저작재산권의 전부를 보유한 저작물의 경우에는 별도의 이용허락 없이 자유이용이 가능합니다. 단, 자유이용이 가능한 자료는 "공공저작물 자유이용허락 표시 기준(공공누리, KOGL) 제4유형"을 부착하여 개방하고 있으므로 공공누리 표시가 부착된 저작물인지를 확인한 이후에 자유이용하시기 바랍니다. 자유이용의 경우에는 반드시 저작물의 출처를 구체적으로 표시하여야 하고 비영리 목적으로만 이용이 가능하며 저작물을 변형하거나 2차 저작물로 사용할 수 없습니다.
<출처표시방법 안내> 작성자, 저작물명, 출처, 권호, 출판년도, 이용조건 [예시1] 김진미 외, "매니코어 기반 고성능 컴퓨팅을 지원하는 경량커널 동향", 전자통신동향분석, 32권 4호, 2017, 공공누리 제4유형 [예시2] 심진보 외, "제4차 산업 혁명과 ICT - 제4차 산업 혁명 선도를 위한 IDX 추진 전략", ETRI Insight, 2017, 공공누리 제 4유형
공공누리가 부착되지 않은 자료들을 사용하고자 할 경우에는 담당자와 사전협의한 이후에 이용하여 주시기 바랍니다.