ETRI-Knowledge Sharing Plaform

KOREAN
논문 검색
Type SCI
Year ~ Keyword

Detail

Journal Article 웨이블릿 기반 저비트 양자화를 이용한 확산 모델 경량화
Cited - time in scopus Download 26 time Share share facebook twitter linkedin kakaostory
Authors
서용석, 임동혁
Issue Date
2026-05
Citation
한국디지털콘텐츠학회논문지, v.27, no.5, pp.1351-1358
ISSN
1598-2009
Publisher
한국디지털콘텐츠학회
Language
Korean
Type
Journal Article
DOI
https://dx.doi.org/10.9728/dcs.2026.27.5.1351
Abstract
확산 모델은 최첨단 이미지 생성 성능을 제공하지만, 높은 메모리 연산 요구로 인해 운용 비용이 매우 크다. 본 연구는 SDXL을 위한 웨이블릿 기반 저비트 양자화 파이프라인을 제안하며, 가중치 중심 채널별 평활화와 U-Net 중간 특징맵에 적용하는 DWT를 결합한다. DWT는 에너지를 LL 서브밴드에 집중시켜 구조적 정보를 보존하고, 서브밴드 특성에 따라 비트폭을 달리하는 차등 양자화를 가능하게 한다. 또한 제안한 평활화는 가중치 중심의 스케일 재배치를 통해 활성값 이상치의 영향을 완화한다. RTX 6000 GPU에서 실험한 결과, 제안한 Wavelet-INT4 모델은 최대 VRAM을 약 70% 절감하고, 1024×1024 해상도에서 FP32 대비 1.24배 빠른 추론을 달성했으며, 동일 프롬프트에서 CLIP-FID 차이 5 이하로 품질도 유지했다. 이는 특징맵에 대한 웨이블릿 분석과 가중치 중심 평활화의 결합이 품질, 속도, 메모리 효율 사이의 균형을 개선하여, 소비자용 GPU 환경에서도 실용적인 저비트 확산 모델 운용 가능성을 보여줌을 의미한다.
Keyword
확산 모델, 경량화, 양자화, 저비트, 웨이블릿 변환
This work is distributed under the term of Creative Commons License (CCL)
(CC BY NC)
CC BY NC