Conference Paper
ISO/IEC JTC1/SC29/WG6에서의 기계를 위한 오디오 부호화 탐색
Cited - time in
Share
Authors
김상욱
Issue Date
2026-06
Citation
한국방송·미디어공학회 학술 대회 (하계) 2026, pp.1-4
Publisher
한국방송·미디어공학회
Language
Korean
Type
Conference Paper
Abstract
본 논문에서는 기계를 위한 오디오 부호화 표준화 동향을 분석하고 앞으로 진행될 표준 개발 방향을 예상한다.
지금까지의 오디오 부호화 기술은 인간을 대상으로 개발되어 왔다. 최근 인공지능 기술의 발전과 함께 기계가
인간의 역할을 대신하는 경우들이 많아 지고 있다. 인간이 소리를 듣고 반응하는 것과 같이, 기계가 귀와 같이
센서를 통해 소리를 채집하고, 인간 청각기관의 생태학적 특성, 생리학적 특성과 심리학적 특성을 반영하여 소리를
처리하던 것을 기계를 대상으로 처리할 때에 효과적으로 진행할 수 있는 방법에 대해 연구가 진행되고 있다. 기계를
위한 오디오 부호화 표준에서는 단순한 신호 압축을 넘어서 기계 학습과 부호화를 함께 고려하는 방향으로 개발
중이다. 기계를 위한 오디오 비트스트림은 압축된 오디오 신호와 함께 센서 위치, 환경 정보, 어노테이션, 라이센스
등의 메타데이터를 함께 부호화하어 사용한다. 오디오 신호와 함께 메타데이터 부가 정보를 활용하여 기계가 보다
효율적으로 소리를 취득하고, 학습하고 분석할 수 있는 오디오 형식에 대한 국제표준기술 제정에 관심을 가져야할
필요가 있다.
Copyright Policy
ETRI KSP Copyright Policy
The materials provided on this website are subject to copyrights owned by ETRI and protected by the Copyright Act. Any reproduction, modification, or distribution, in whole or in part, requires the prior explicit approval of ETRI. However, under Article 24.2 of the Copyright Act, the materials may be freely used provided the user complies with the following terms:
The materials to be used must have attached a Korea Open Government License (KOGL) Type 4 symbol, which is similar to CC-BY-NC-ND (Creative Commons Attribution Non-Commercial No Derivatives License). Users are free to use the materials only for non-commercial purposes, provided that original works are properly cited and that no alterations, modifications, or changes to such works is made. This website may contain materials for which ETRI does not hold full copyright or for which ETRI shares copyright in conjunction with other third parties. Without explicit permission, any use of such materials without KOGL indication is strictly prohibited and will constitute an infringement of the copyright of ETRI or of the relevant copyright holders.
J. Kim et. al, "Trends in Lightweight Kernel for Many core Based High-Performance Computing", Electronics and Telecommunications Trends. Vol. 32, No. 4, 2017, KOGL Type 4: Source Indication + Commercial Use Prohibition + Change Prohibition
J. Sim et.al, “the Fourth Industrial Revolution and ICT – IDX Strategy for leading the Fourth Industrial Revolution”, ETRI Insight, 2017, KOGL Type 4: Source Indication + Commercial Use Prohibition + Change Prohibition
If you have any questions or concerns about these terms of use, or if you would like to request permission to use any material on this website, please feel free to contact us
KOGL Type 4:(Source Indication + Commercial Use Prohibition+Change Prohibition)
Contact ETRI, Research Information Service Section
Privacy Policy
ETRI KSP Privacy Policy
ETRI does not collect personal information from external users who access our Knowledge Sharing Platform (KSP). Unathorized automated collection of researcher information from our platform without ETRI's consent is strictly prohibited.
[Researcher Information Disclosure] ETRI publicly shares specific researcher information related to research outcomes, including the researcher's name, department, work email, and work phone number.
※ ETRI does not share employee photographs with external users without the explicit consent of the researcher. If a researcher provides consent, their photograph may be displayed on the KSP.