ETRI-Knowledge Sharing Plaform

KOREAN
논문 검색
Type SCI
Year ~ Keyword

Detail

Journal Article 국가R&D보고서의 보존 및 서비스 향상을 위한 XML 기반 콘텐츠 추출, 변환 시스템 개발
Cited - time in scopus Share share facebook twitter linkedin kakaostory
Authors
최규진, 차승준, 이규철
Issue Date
2014-04
Citation
데이타베이스연구, v.30, no.1, pp.51-64
ISSN
1598-9798
Publisher
한국정보과학회 데이타베이스연구회 (KISS SIGD)
Language
Korean
Type
Journal Article
Abstract
최근 국가R&D사업에 대한 투자비용이 크게 증가함에 따라, 연구개발 성과의 체계적인 관리가 필요하다. 이를위해 현재 국가차원에서 국가R&D보고서 종합관리시스템을 운영하여 PDF 형식의 보고서 원문을 수집 및 관리한다. 하지만 연구관리전문기관 별로 보고서의 형태와 기준이 상이하여 표준화된 데이터베이스 구축이 어렵고, 텍스트 기반의 검색 서비스만을 제공하기 때문에 수천, 수 만개 이상의 검색 결과들에서 사용자가 원하는 문서를 다시찾아내야 하는 문제점을 가진다. 본 논문에서는 국가R&D보고서의 보존 및 서비스 향상을 위한 XML 기반 콘텐츠추출 및 변환시스템을 개발하였다. 이를 위해 다양한 보고서를 수용할 수 있는 XML 스키마를 설계하고, 보고서를스키마에 맞게 구조화할 수 있는 XML 변환도구를 개발하였다. 개발된 도구는 메타데이터 및 본문 콘텐츠를 자동으로 추출하여 구조화 하여 저장한다. 또한 표, 그림 이미지를 추출하는 기능을 개발하여 보고서에 저장된 비텍스트 콘텐츠도 추출 저장한다. 저장된 XML은 다양한 검색 기법의 적용을 통해 대국민 서비스가 향상될 수 있다.