ETRI-Knowledge Sharing Plaform

KOREAN
논문 검색
Type SCI
Year ~ Keyword

Detail

Journal Article 뉴럴 및 심볼릭 방법을 통합한 하이브리드 단락 검색
Cited - time in scopus Share share facebook twitter linkedin kakaostory
Authors
배용진, 이공주
Issue Date
2022-07
Citation
한국정보기술학회논문지, v.20, no.7, pp.11-17
ISSN
1598-8619
Publisher
한국정보기술학회
Language
Korean
Type
Journal Article
DOI
https://dx.doi.org/10.14801/jkiit.2022.20.7.11
Abstract
뉴럴 검색은 심볼릭 검색의 미스매칭 문제를 해결하는 장점이 있으나, 여전히 특정 질문과 단락 환경에서는 심볼릭 검색의 효율이 높아 두 방법론이 병행되어 연구되고 있다. 본 논문에서는 한국어 텍스트 환경에서 두 검색 방법을 통합한, 뉴럴-심볼릭 하이브리드 검색을 제안한다. 하이브리드 검색시 사용되는 자질은 텀 빈도 기반의 심볼릭 자질 벡터와 언어모델 기반의 인코더로 생성한 뉴럴 자질 벡터이다. 유사도를 계산할 때는 생성된 두 자질 벡터를 결합하여 질문-단락 간 적합성 점수를 계산하였다. 실험 결과 단일 검색 방법 대비 위키피디아 및 오피스 문서 컬렉션에서 BR@Top1이 6.35%, 4.41% 각각 성능이 향상되었고, BR@Top50에서도 1.00%, 0.73% 성능이 향상되었다.