ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

특허 검색
구분 출원국
출원년도 ~ 키워드

상세정보

등록 신경망 모델을 이용한 오디오 신호의 부호화 및 복호화 방법 및 이를 수행하는 부호화기 및 복호화기

신경망 모델을 이용한 오디오 신호의 부호화 및 복호화 방법 및 이를 수행하는 부호화기 및 복호화기
이미지 확대
발명자
성종모, 임우택, 장인선, 백승권, 이태진, 이미숙
출원번호
10-2021-0052262 (2021.04.22) KIPRIS
공개번호
10-2022-0005386 (2022.01.13)
등록번호
10-2505834-0000 (2023.02.27)
출원국
대한민국
협약과제
20ZH1200, 초실감 입체공간 미디어·콘텐츠 원천기술연구, 이태진
초록
신경망 모델을 이용한 오디오 신호의 부호화 및 복호화 방법과 신경망 모델의 트레이닝 방법 및 이를 수행하는 부호화기 및 복호화기가 개시된다. 본 발명의 일실시예에 따른, 부호화 방법은 순환 부호화 모델을 이용하여, 상기 입력 신호에 대한 제1 특징 정보를 생성하는 단계; 상기 제1 특징 정보를 양자화하여 양자화된 제1 특징 정보와 제1 비트스트림을 출력하는 단계; 순환 복호화 모델을 이용하여, 상기 양자화된 제1 특징 정보로부터 제1 출력 신호를 생성하는 단계; 비순환 부호화 모델을 이용하여, 상기 입력 신호에 대한 제2 특징 정보를 생성하는 단계; 상기 제2 특징 정보를 양자화하여 양자화된 제2 특징 정보와 제2 비트스트림을 출력하는 단계; 비순환 복호화 모델을 이용하여, 상기 양자화된 제2 특징 정보로부터, 제2 출력 신호를 생성하는 단계; 상기 입력 신호와 상기 제1, 2 출력 신호 및 상기 제1, 2 비트스트림을 이용하여 부호화 모드를 결정하는 단계; 및 상기 부호화 모드에 따라 선택된 상기 제1 비트스트림 또는 제2 비트스트림과 부호화 모드 비트를 다중화하여 전체 비트스트림을 출력하는 단계를 포함할 수 있다.
KSP 제안 키워드
Audio signal, Encoding and decoding, Network model, neural network, neural network model