ETRI-Knowledge Sharing Plaform

KOREAN
논문 검색
Type SCI
Year ~ Keyword

Detail

Conference Paper ISO/IEC JTC1/SC29/WG6에서의 기계를 위한 오디오 부호화 탐색
Cited - time in scopus Share share facebook twitter linkedin kakaostory
Authors
김상욱
Issue Date
2026-06
Citation
한국방송·미디어공학회 학술 대회 (하계) 2026, pp.1-4
Publisher
한국방송·미디어공학회
Language
Korean
Type
Conference Paper
Abstract
본 논문에서는 기계를 위한 오디오 부호화 표준화 동향을 분석하고 앞으로 진행될 표준 개발 방향을 예상한다. 지금까지의 오디오 부호화 기술은 인간을 대상으로 개발되어 왔다. 최근 인공지능 기술의 발전과 함께 기계가 인간의 역할을 대신하는 경우들이 많아 지고 있다. 인간이 소리를 듣고 반응하는 것과 같이, 기계가 귀와 같이 센서를 통해 소리를 채집하고, 인간 청각기관의 생태학적 특성, 생리학적 특성과 심리학적 특성을 반영하여 소리를 처리하던 것을 기계를 대상으로 처리할 때에 효과적으로 진행할 수 있는 방법에 대해 연구가 진행되고 있다. 기계를 위한 오디오 부호화 표준에서는 단순한 신호 압축을 넘어서 기계 학습과 부호화를 함께 고려하는 방향으로 개발 중이다. 기계를 위한 오디오 비트스트림은 압축된 오디오 신호와 함께 센서 위치, 환경 정보, 어노테이션, 라이센스 등의 메타데이터를 함께 부호화하어 사용한다. 오디오 신호와 함께 메타데이터 부가 정보를 활용하여 기계가 보다 효율적으로 소리를 취득하고, 학습하고 분석할 수 있는 오디오 형식에 대한 국제표준기술 제정에 관심을 가져야할 필요가 있다.