ETRI-Knowledge Sharing Plaform

KOREAN
논문 검색
Type SCI
Year ~ Keyword

Detail

Conference Paper CRF에 기반한 한국어 형태소 분할 및 품사 태깅
Cited - time in scopus Share share facebook twitter linkedin kakaostory
Authors
나승훈, 양성일, 김창현, 권오욱, 김영길
Issue Date
2012-10
Citation
한글 및 한국어 정보 처리 학술 대회 2012, pp.12-15
Publisher
한국정보과학회 (KIISE)
Language
Korean
Type
Conference Paper
Abstract
본 논문은 한국어 형태소 분할 및 품사 태깅을 위해 조건부 랜덤 필드 (CRF: conditional random field)에 기반한 방식을 제안한다. 제안 방법은 1) 형태소 분할 단계 2) 품사 태깅 단계 3) 복합형태소 분할 및 태깅 단계의 세 단계로 이루어진다. 처음 두 단계는 CRF방법에 기반을 두고, 세 번째 단계에서는 일반화된 HMM (lattice-HMM)을 활용한다. 제안 방법은 세종 말뭉치 코퍼스에서 5-fold cross-validation로 평가한 결과, 약 96%의 품사 태깅 성능을 보여주었다.
KSP Keywords
Conditional Random Field(CRF)