ETRI-Knowledge Sharing Plaform

KOREAN
특허 검색
Status Country
Year ~ Keyword

Detail

Registered Methods for Encoding and Decoding Audio Signal Using Neural Network Model, and Devices for Performing the Same

신경망 모델을 이용한 오디오 신호의 부호화 및 복호화 방법 및 이를 수행하는 부호화기 및 복호화기
이미지 확대
Inventors
Sung Jongmo, Jang Inseon, Lim Woo-Taek, Beack Seung Kwon, Lee Mi Suk, Lee Tae Jin
Application No.
10-2021-0052262 (2021.04.22) KIPRIS
Publication No.
10-2022-0005386 (2022.01.13)
Registration No.
10-2505834-0000 (2023.02.27)
Country
KOREA
Project Code
20ZH1200, The research of the fundamental media·contents technologies for hyper-realistic media space, Lee Tae Jin
Abstract
신경망 모델을 이용한 오디오 신호의 부호화 및 복호화 방법과 신경망 모델의 트레이닝 방법 및 이를 수행하는 부호화기 및 복호화기가 개시된다. 본 발명의 일실시예에 따른, 부호화 방법은 순환 부호화 모델을 이용하여, 상기 입력 신호에 대한 제1 특징 정보를 생성하는 단계; 상기 제1 특징 정보를 양자화하여 양자화된 제1 특징 정보와 제1 비트스트림을 출력하는 단계; 순환 복호화 모델을 이용하여, 상기 양자화된 제1 특징 정보로부터 제1 출력 신호를 생성하는 단계; 비순환 부호화 모델을 이용하여, 상기 입력 신호에 대한 제2 특징 정보를 생성하는 단계; 상기 제2 특징 정보를 양자화하여 양자화된 제2 특징 정보와 제2 비트스트림을 출력하는 단계; 비순환 복호화 모델을 이용하여, 상기 양자화된 제2 특징 정보로부터, 제2 출력 신호를 생성하는 단계; 상기 입력 신호와 상기 제1, 2 출력 신호 및 상기 제1, 2 비트스트림을 이용하여 부호화 모드를 결정하는 단계; 및 상기 부호화 모드에 따라 선택된 상기 제1 비트스트림 또는 제2 비트스트림과 부호화 모드 비트를 다중화하여 전체 비트스트림을 출력하는 단계를 포함할 수 있다.