ETRI Knowledge Sharing Platform : 다차원 변환을 이용한 효과적인 비디오 압축 알고리즘

BROWSE

Titles

논문 검색
Type		SCI
Year	~	Keyword

Detail

List

Journal Article 다차원 변환을 이용한 효과적인 비디오 압축 알고리즘

Cited - time in scopus

Authors: 안창범, 전수열, 심동규, 박호종, 손채봉, 정세윤, 오승준

Issue Date: 2008-06

Citation: 한국화상학회지, v.14, no.2, pp.81-86

ISSN: 1226-0517

Publisher: 한국화상학회

Language: Korean

Type: Journal Article

Abstract: 비디오 데이터의 압축효율을 향상시킬 수 있는 새로운 다차원 DCT (Discrete Cosine Transform) 기반의 알고리즘을 제안하였다. H.264 국제 표준에서 사용하는 4×4 변환은 블록의 크기가 작기 때문에 움직임 보상 (motion compensation) 에서는 뛰어난 성능을 보이나, 공간 상관도를 활용하는 데는 한계가 있다. 제안한 알고리즘은 H.264와 동일한 4×4 변환을 이용하여 움직임 보상 성능은 유지하면서, 인접한 블록의 2차원 DCT 계수들을 동일한 주파수 별로 모아 추가적인 변환을 적용하여 공간 상관도의 활용을 높였다. 테스트 시퀀스에 대하여 제안한 변환 방법을 이용하여 기존의 방법에 비해 동일한 비트율에서 높은 화질을 얻을 수 있었다. 제안한 변환 방법을 비디오 코덱 설계에 적용한다면, H.264 보다 높은 압축율의 코덱을 설계할 수 있을 것으로 기대한다.1. 서 론통신 기술과 컴퓨터 및 멀티미디어 등의 발전으로 다양한 매체의 통신이나 저장에 대한 필요가 증가하고 있다. 멀티미디어 매체 중 비디오는 공간과 시간의 복합적인 데이터로 양이 매우 커 전송이나 저장에 어려움이 많다. 최근 고화질 TV 등의 보급으로 해상도가 향상됨에 따라 데이터 양은 더욱 증가하고 있는데, 이를 해결하기 위한 한 방법으로 비디오 데이터의 효과적인 압축이 부각되고 있다.ISO와 ITU 등 국제표준화기구에서는 다양한 비디오 압축의 국제 표준을 만들어왔다. ITU-T/ ISO의 H.264 국제표준은 비디오 코덱 중 가장 뛰어난 압축효율을 가지고 있는 것으로 알려져 있다. 기존의 코덱에 비하여 성능의 개선을 이룬 주된 원인은 intra-frame 및 1/4화소 움직임 예측을 통해 예측 에러를 최소화 한데 기인한다. H.264 이전의 코덱들이 공간 상관도(spatial correlation)를 활용하는 데 초점을 맞추어 블록 크기를 8×8로 한 반면, H.264는 시간적 매칭(temporal matching)을 잘 이루기 위하여 블록 크기를 4×4 로 줄여 움직임 보상의 성능을 극대화 하였다 [1-4]. 따라서 H.264는 움직임 보상에는 뛰어난 성능을 나타내는 반면, 공간 상관도의 이용에는 한계를 보이고 있다 [5].본 논문에서는 H.264에서 사용하고 있는 4x4 블록의 움직임 보상 기능은 유지하면서, 4×4 블록 내에서 제한적으로 이루어지고 있는 공간 상관도의 활용을 4×4×4 또는 4×4×4×4로 확장하여 성능을 개선하는 다차원 변환을 제안하였다. 비디오 영상에서 대부분의 개체들이 4×4 블록 보다 훨씬 크기 때문에 인접한 에러 블록들 간에 공간 상관도가 존재할 가능성이 높다. 이를 활용하기 위하여 기존의 4×4 블록에서 적용하던 2차원 DCT를 확장하여 인접한 4개의 블록을 묶어서 주파수 별로 추가적으로 1차원 DCT(3차원 DCT)를 적용하는 것과, 16개의 인접 블록에서 주파수 별로 다시 2차원 DCT를 적용하는 알고리즘(4차원 DCT)을 제안하였다 [5-6]. 본 논문에서는 표준 비디오 시퀀스들에 대하여 기존의 2차원 DCT와 제안된 다차원 DCT로 인코딩한 계수를 양자화한 후 이들을 discrete memoryless source라고 가정하고 엔트로피 대비 양자화 과정에 의한 왜곡으로 rate-distortion 곡선을 구하여 성능비교를 수행하였다.

KSP Keywords: Discrete cosine Transform, ITU-T, Motion Compensation(MoCo), Rate-Distortion, Temporal matching, intra-frame, spatial correlation

ETRI-Knowledge Sharing Plaform

BROWSE

Titles

Detail

ETRI