ETRI-Knowledge Sharing Plaform

KOREAN
논문 검색
Type SCI
Year ~ Keyword

Detail

Journal Article 샘플링 데이터를 이용한 혼합 밀도 네트워크 모델기반 근사 질의 처리
Cited - time in scopus Share share facebook twitter linkedin kakaostory
Authors
김성수, 박춘서, 남택용, 이태휘
Issue Date
2022-09
Citation
정보과학회 컴퓨팅의 실제 논문지, v.28, no.9, pp.150-157
ISSN
2383-6318
Publisher
한국정보과학회
Language
Korean
Type
Journal Article
DOI
https://dx.doi.org/10.5626/KTCP.2022.28.9.450
Abstract
소셜 네트워크와 사물 인터넷이 활성화 되면서, 대규모 데이터에 대한 탐사적 분석은 빅데이터 분석에서 중요한 프로세스 중 하나로 자리 잡고 있다. 그러나, 데이터 분석가는 초기 빅데이터 분석을 수행하는 데 상당한 처리 시간과 비용을 지불해야 한다. 본 논문에서는 대규모 데이터에 대한 탐사적 분석을 효율적으로 지원하기 위해 시놉시스 기반의 근사 질의 처리 기법과 머신러닝을 이용한 근사 질의 처리기법을 제안한다. 또한, 제안하는 시놉시스 기반의 기법은 전통적인 통계적 샘플링 기법 뿐만 아니라, 딥러닝 기반 생성 모델을 이용하여 시놉시스 데이터를 구축하는 기법을 제안한다. 특히, DBMS 외부 인터페이스를 통한 질의 처리 방식을 적용함으로써, 다양한 DBMS에 적용 가능하다는 장점을 제공한다. 학습 데이터 구축을 위한 이력 질의 수행에 많은 비용이 소요되는 워크로드기반 근사 질의 처리 모델의 단점을 극복하기 위해, 시놉시스 데이터의 분포를 혼합 밀도 네트워크를 통해 학습하는 ML 기반 근사 질의 처리모델을 제안한다. 제안 기법은 인스타카트 데이터 셋 실험에서 기존 MySQL 대비 380배, PostgreSQL 대비 58배 빠른 질의 처리 성능을 제공하고, 근사 질의 정확도 측면에서 워크로드 기반 근사 질의 처리 엔진인 ML-AQP보다 정확한 결과를 제공한다.