ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

논문 검색
구분 SCI
연도 ~ 키워드

상세정보

학술지 대용량 데이터의 내용 기반 검색을 위한 분산 고차원 색인 구조
Cited - time in scopus Download 4 time Share share facebook twitter linkedin kakaostory
저자
최현화, 이미영, 김영창, 장재우, 이규철
발행일
201010
출처
정보과학회논문지 : 데이타베이스, v.37 no.5, pp.228-237
ISSN
1229-7739
출판사
한국정보과학회 (KIISE)
협약과제
10MS4400, 메모리 가상화 기반 데이터 폭증 대응형 플랫폼 기술 개발, 이미영
초록
고차원 데이터에 대한 다양한 색인 구조가 제안되어 왔음에도 불구하고, 인터넷 서비스로서 이미지 및 동영상의 내용 기반 검색을 지원하기 위해서는 고확장성 지원 및 k-최근접점 검색 성능 향상을 지원하는 새로운 고차원 데이터의 색인 구조가 절실히 요구된다. 이에 우리는 다중 컴퓨팅 노드를 바탕으로 구축되는 분산 색인 구조로 분산 벡터 근사 트리(Distributed Vector Approximation-tree)를 제안한다. 분산 벡터 근사 트리는 대용량의 고차원 데이터로부터 추출한 샘플 데이터를 바탕으로 hybrid spill-tree를 구축하고, hybrid spill-tree의 말단 노드 각각에 분산 컴퓨팅 노드를 매핑하여 VA-file을 구축하는 두 레벨의 분산 색인 구조이다. 우리는 다중 컴퓨팅 노드들 상에 구축된 분산 벡터 근사 트리를 바탕으로 병렬 k-최근접점 검색을 수행함으로써 검색 성능을 향상시킨다. 본 논문에서는 서로 다른 분포의 데이터 집합을 바탕으로 한 성능 시험 결과를 통하여, 분산 벡터 근사 트리가 기존의 고확장성을 지원하는 색인 구조와 비교하여 검색 정확도에 대한 손실 없이 더 빠른 k-최근접점 검색을 수행함을 보인다.