ETRI-Knowledge Sharing Plaform

KOREAN
논문 검색
Type SCI
Year ~ Keyword

Detail

Conference Paper Soundstream 음향 신호 부호화 모델의 Generator 선 학습 방법을 통한 높은 주파수 대역의 복원 품질 안정화 연구
Cited - time in scopus Share share facebook twitter linkedin kakaostory
Authors
이대호, 김민한, 신승현, 이석진, 임우택
Issue Date
2023-06
Citation
한국방송·미디어공학회 학술 대회 (하계) 2023, pp.1-4
Publisher
한국방송·미디어공학회
Language
Korean
Type
Conference Paper
Abstract
본 논문에서는 기계 학습 기반 음향 신호 부호화 모델을 이용한 음향 복원 시 발생하는 높은 주파수 대역의 품질이 저하되는 문제를 개선하기 위한 방법을 제안한다. 최근 기계 학습을 기반으로 한 음향 신호처리에 대한 연구가 활발히 이루어지고 있으나, 높은 비트율에서는 아직 기존 오디오 코덱의 성능보다 높은 품질을 얻지 못하고 있다. 본 연구에서는 기계 학습 기반 음향 신호 부호화 모델의 주요 구조인 generator 와 discriminator 를 분석하며, 높은 주파수 대역의 복원 품질을 안정화하기 위해 generator 를 먼저 학습하는 방법을 제안한다.