ETRI-Knowledge Sharing Plaform

KOREAN

BROWSE

Titles

Home Titles Articles

논문 검색
Type		SCI
Year	~	Keyword

Detail

List

Conference Paper 저지연 조건하의 심층신경망 기반 음성 압축

Cited - time in scopus

scopus

Share

Authors: 김병현, 강홍구, 장인선

Issue Date: 2024-06

Citation: 한국방송·미디어공학회 학술 대회 (하계) 2024, pp.1-4

Publisher: 한국방송·미디어공학회

Language: Korean

Type: Conference Paper

Abstract: 본 논문에서는 심층신경망 기반 음성 압축 모델의 지연 시간 단축에 따른 성능 변화를 분석하고, 보다 효과적인 저지연 모델 설계 방식을 제안한다. 최근 제안된 심층신경망 기반 오디오 및 음성 압축 모델들은 낮은 비트 전송률에서 기존의 신호처리 기반의 코덱 대비 뛰어난 복원 성능을 달성하였다. 그러나, 대부분의 심층신경망 기반 모델은 기존 신호처리 기반 오디오 코덱 과 유사한 지연시간을 필요로 한다. 따라서, 본 논문에서는 합성곱 신경망 기반 오디오 압축 모델의 지연시간을 단축시킴으로써 오는 성능 변화를 분석하고, 수용장의 확장 등 구조 변경을 통해 저지연 조건에서도 기존 모델과 유사한 복원 성능을 달성할 수 있음을 보인다.

Copyright Policy Privacy Policy

ETRI

218 Gajeong-ro, Yuseong-gu, Daejeon, 34129, KOREA, Contact: sh.kim@etri.re.kr

2016 Electronics and Telecommunications Research Institute. All rights reserved.

Please refrain from automatic collection of e-mail addresses posted on this homepage.