ETRI-Knowledge Sharing Plaform

KOREAN
연구보고서 검색
Type Funding Org. Research Org.
Year ~ Keyword

Detail

빅데이터 활용을 위한 지식 자산 구축 및 실시간 Linked Data 응용 기술 개발 (2차년도)
Download 43 time
Participants
박원주, 조기성, 남궁현, 이경하
Published
201401
Type
Annual Report
Keyword
공공 데이터, 시맨틱 웹, 매쉬업 플랫폼, 클라우드
KSP Keywords
Big-data, Knowledge Base, LINKED DATA, Real-time
Funding Org.
미래창조과학부
Research Org.
한국전자통신연구원
Project Code
13PR1800, Development of Real-time Linked Data Technology and Knowledge Base for Utilizing Big Data, Cho Kee Seong
Abstract
1. 단계목표
가. 최종목표
빅데이터 응용 서비스의 효과적인 개발을 위해 이질적 데이터 집합들 간 의미적
상호운용성(Semantic Interoperability)과 매쉬업을 가능하게 하는 Linked Data 기
반 서비스 플랫폼 개발
나. 연차별 목표
(1) 공공 Linked Data 지식자산 플랫폼 기반 기술 확보 및 활용 시나리오 도출
- 공공 데이터 획득 및 Linked Data로의 변환, 공개
- 대용량 Linked Data 저장, 검색을 위한 분산 플랫폼 기술 개발
- 매쉬업 플랫폼을 통해 활용하기 위한 시나리오 도출
(2) 공공 Linked Data 지식 자산 플랫폼 및 Open API 개발
- 데이터 변환 규칙 확장 및 데이터 증분 기술 기반의 외부 연계 공공
데이터 변환 기술 개발
- 비정형 텍스트 데이터로부터의 컨텍스트 정보 추출 및 공공 Linked Data
도메인 인스턴스 기반의 시맨틱 태깅 기술 개발
- 사용자 위치 정보 컨텍스트에 따른 위치 기반 추천 및 검색 기술 개발
- 대용량 Linked Data의 분산 저장 및 질의 처리 기술
- 실체화 뷰(materialized view)를 통한 Linked data 질의 처리 최적화 기술
- 공공 Linked Data 매쉬업 플랫폼 기술 개발 및 Open API 서비스
- 공공 정보 Linked data에 기반한 모바일 앱 서비스의 개발 (HealthyLife)
(3) 공공 지식자산 플랫폼의 의미적 상호운용성 실현 및 시범 서비스 개발
- 비정형 텍스트 의미적 연결을 통한 의미관계 생성 기술 개발
- 클라우드 기반 분산 Linked Data 인덱스 구축 기술 개발
- 공공 Linked Data와 외부 서비스의 매쉬업을 통한 시범 서비스 제공
2. 개발내용 및 결과(2차년도)
(1) 공공데이터의 Linked Data 변환 및 비정형 텍스트 데이터 처리 기술 개발
- Linked Data 도메인 인스턴스 기반의 비정형 데이터 시맨틱 태깅 기술
- 비정형 텍스트 데이터 컨텍스트 추출 및 제공 기술 개발
- 사용자 위치정보 따른 위치 기반 컨텐츠 추천/검색 기술
- 데이터 변환 규칙 확장 및 데이터 증분 기술 기반 외부 연계 공공
데이터 변환 기술 개발
- 대용량 데이터의 분산환경 기반 Linked Data 변환 기술 개발
▣ 결과물
- 필수 공공 데이터셋 8건 확보 및 변환
- 빅데이터 스마트 시범서비스(국민건강 주의예보, 보건의료 빅데이터 활용,
의약품 안전성 조기경보, 점포평가, 심야버스 노선정책 지원 등) 참여기관의
데이터 셋 확보
- 공공데이터의 Linked Data 변환을 위한 온톨로지 명세서 Version 2.0
- 공공 Linked Data 변환 기능 설계서 Version 2.0
- 공공 Linked Data 변환 블록 상세설계서 Version 2.0
- 도메인별 공공데이터의 Linked Data 데이터 변환기 S/W 개발 Version 2.0
. 공공 XML 및 JSON 문서의 Linked Data 변환 기술
. 공공 REST API 기반 Linked Data 변환 기술
※ 공공데이터 8건으로부터 626만 Triples 변환
- 비정형 텍스트 의미 연결 생성 기능 설계서 Version 2.0
- 비정형 텍스트 의미 연결 모듈 상세 설계서 Version 2.0
- 비정형 텍스트 컨텍스트 추출 및 랭킹 S/W(Version 2.) 개발 및 기술이전 1
건(3천만원) 완료
- 현재 위치 기반 공공데이터, 비정형 데이터 매쉬업 기반의 응용 시범 서비스
개발 완료
(2) 분산된 대규모 Linked Data에 대한 효율적인 접근과 처리 및 관리를
위한 Linked Data 서비스 기술 연구 개발
- 저장 공간 오버헤드와 집계 연산의 최소화 위한 RDF 저장 기법
- Data sharding에 기반을 둔 대용량 RDF 데이터의 분산 저장 기술
- SPARQL 질의의 분산 질의 처리 기술
- 실체화뷰 기법을 통한 질의 최적화 기술
▣ 결과물
- 클라우드 기반 Linked Data 인덱싱 기능 설계서 Version 2.0
- Linked Data 인덱싱 블록 상세설계서 Version 2.0
- 대용량 Linked Data 질의 처리 기술 설계 및 SW 개발
. MongoDB 기반의 대용량 RDF 분산 저장 기술
. SPARQL 파싱 및 질의 처리 기술
. LUBM1) 질의처리 시험 완료
. 실체화 뷰 기법에 따른 SPARQL 질의 최적화 기술
(3) 응용서비스 개발과 활용을 위한 Linked Data 매쉬업서비스 플랫폼 기술
- 공공 Linked Data에 대한 SPARQL기반 질의 서비스 개발
- Linked Data 기반 매쉬업 개발 도구 기술 개발
- 매쉬업 블록 및 도구를 통한 Linked Data 기반 데모 개발
▣ 결과물
- Linked Data 매쉬업 플랫폼 기능 설계서 Version 2.0
- Linked Data 매쉬업 플랫폼 블록 상세 설계서 Version 2.0
- Linked Data 매쉬업 플랫폼 기술 S/W 개발
. 공공데이터 SPARQL 기반 API 및 매쉬업 프로토타입 기술 개발
. 사용자의 숙련도기반 차별화된 인터페이스 별도 제공
. 모바앨 매쉬업 저작도구 AppDron용 매쉬업 블록 및 데모 개발
(4) 이질적 Linked Data의 의미적 상호운용성을 실현한 공공데이터 응용
서비스 개발
- 서비스를 위한 필수 데이터 셋 정의 및 데이터 흐름/매쉬업 설계
- 공공 정보 Linked Data 기반의 모바일 앱 서비스 개발 (HealthyRoad)
- 공공 Linked Data Open API 기반의 매쉬업 서비스 개발
▣ 결과물
- 공공 Linked Data 기반 응용서비스 기능 설계서
- 공공 Linked Data 기반 응용서비스 화면 설계서
- 공공 Linked Data 기반 응용서비스 상세 설계서
- 안드로이드기반의 Healthy Life 응용 어플리케이션 개발
. 카드형 공공 및 민간데이터 매쉬업 서비스 개발
(5) 공공 Linked Data 지식자산 플랫폼 프로토타입 개발
- 플랫폼 핵심 기능 개발 및 통합
- SPARQL 질의 (Open API) 를 통한 시범 서비스 개발
▣ 결과물
- 클라우드 기반 공공 Linked Data 지식 자산 플랫폼 구축
- 사용자/시스템 요구사항정의서 Version 2.0
- 시스템 구조설계서 및 기능규격서 Version 2.0
- 공공 Linked Data 지식자산 플랫폼 시험계획서 및 시험절차서 개발
. R&D 시험검증대상과제로서 시험계획서, 절차서 검토 완료
3. 기대효과(기술적 및 경제적 효과)
o 키워드 중심의 데이터 이용패턴에서 Linked Data 를 활용한 공공 정보 활용을 통한 의미 기반 정보 처리를 실현하고 신개념의 융합 응용의 창출을 가능하게 함
- 비정형 텍스트에 대한 콘텍스트 추출과 시맨틱 태깅 기술을 통해 웹/SNS와
같은 빅데이터에 대한 의미 기반의 분석을 가능
- 대용량 Linked Data에 대한 클라우드 기반의 처리를 통해 시맨틱 처리의 성능
병목을 해소함으로써 시맨틱 기술을 대규모 응용에 적용하기 위한 플랫폼을
확보
o 공공 데이터로부터 시맨틱 기반의 차별화된 전자 정부 서비스 기술의 적용을
가능하게 하는 공공 정보 서비스 기술 선도
- Linked Data 기반의 다양한 공공 데이터의 상호 호환성 확보를 통해 향상된
정보 접근성을 제공
- Linked Data의 의미 정보를 활용함으로써 다양한 기관의 정보 간의 매쉬업과
통합이 용이해져 범부처 차원의 전자정부 서비스를 위한 데이터의 호환성 제공
o 기존 웹 기반 Open API에 Linked Data를 적용함으로써 융합 서비스 개발에
있어서 공공 정보를 활용한 새로운 응용의 출현과 의미 기반의 신개념 융합
응용의 창출을 가능하게 하는 웹 응용 서비스 기술의 경쟁력 확보

- 자료 : KDB, 2012년도 데이터베이스 산업 시장분석 결과보고서, 2012.12 기반 ETRI 추정
- 국내 시장 점유율은 다음커뮤니케이션과 솔트룩스의 시맨틱 웹 시장 점유율을 고려하여 채택
- 해외 시장 점유율은 세계 시장 대비 국내 시장의 규모 (약 10%)를 고려하여 채택
o 시맨틱 웹 세계시장은 ‘13년 약 94억달러 규모에서 7.7%의 성장률로 ’20년
160억 달러에 육박할 전망(NIPA/2010 자료기반 추정)
- 국내시장은 세계시장의 약 10% 규모로 ‘12년 945억원에서 ’20년 1천
6백억원규모로 성장 전망
o Linked Data 기반 시맨틱 데이터 처리 플랫폼 국내시장은 ’14년 625억원 규모에서
연평균 83.3%의 고성장률로 ’20년 1.7조원에 이를 전망(KDB/2012 기반 추정)
- R&D 결과물(공공데이터 활용 플랫폼)의 기술수명주기 5년동안 누적기준 약
6천7백억원의 생산유발, 3천1백억원의 부가가치 유발, 7천여명의 고용창출
효과가 기대
- 1차 시장인 관련 솔루션(SW플랫폼)외에 2차 시장인 플랫폼 구축 및 컨설팅,
플랫폼 운영을 통한 정보 및 광고 서비스 등 시장의 형성에 따라 관련
업자들에게 지속적인 수익 창출 기회 부여
- 특히, 최근 국내외 정부의 공공정보 개방 추세에 따라, 이에 기반한
지식서비스 플랫폼 구축 및 콘텐츠(광고) 서비스 제공 시장의 성장이 예상
4. 적용분야
o 정부의 공공 정보 제공 서비스 플랫폼으로 활용
- 공공 데이터를 의미 정보가 부가된 Linked Data 형식으로 민간에 공개하는
서비스 플랫폼으로 사용
- Linked Data 형식의 공개를 통해 데이터의 자유로운 활용과 다양한 응용
서비스의 생성을 촉진함
o 포털의 개방형 서비스 플랫폼으로 활용
- 포털의 개방형 API와 함께 공공 데이터에 대한 API를 제공하고 매쉬업을
지원하는 플랫폼으로 활용
- 공공 데이터에 대한 접근을 위한 API를 제공함으로써 기존의 포털 API와의
매쉬업을 통한 새로운 서비스의 창출
o 빅데이터 처리를 위한 클라우드 플랫폼으로 활용
- 웹, SNS 등 빅데이터에 대한 클라우드 기반의 시맨틱 정보 분석 플랫폼으로
활용
- 빅데이터에 대한 클라우드 기반의 시맨틱 정보 처리를 가능하게 함으로서
소셜 데이터 분석 등의 빅데이터 응용의 상용화를 촉진
o 시맨틱 검색 등 차세대 웹 서비스 플랫폼으로 활용
- 웹, SNS 등에 대한 시맨틱 정보 추출을 통한 차세대 웹 서비스 플랫폼에서의
의미 정보 추출 플랫폼으로 활용
- 도메인 콘텍스트에 대한 추출을 가능하게 함으로써 보다 정교한 시맨틱 정보
추출을 가능하게 하여 시맨틱 웹 서비스의 활성화에 기여