ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

논문 검색
구분 SCI
연도 ~ 키워드

상세정보

학술지 이종 문자가 혼합된 필기체 이미지 대상 글자 인식기의 구현
Cited - time in scopus Download 18 time Share share facebook twitter linkedin kakaostory
저자
김홍숙, 김정시
발행일
202108
출처
한국통신학회논문지, v.46 no.8, pp.1284-1293
ISSN
1226-4717
출판사
한국통신학회 (KICS)
협약과제
21HS1900, 스마트기기를 위한 온디바이스 지능형 정보처리 가속화 SW플랫폼 기술 개발, 김정시
초록
본 논문에서는 한글, 영문, 숫자 및 특수 기호 4종의 글자들이 혼합된 필기체 이미지를 입력으로 하는 글자 인식 엔진의 구현 과정에 대하여 설명한다. 심층 학습 기반 신경망 모델 학습을 위한 대용량 데이타셋은 폰트 기반의 글자 이미지를 기반으로 데이타 증강 기법을 통하여 확보하였다. 글자 인식 엔진의 핵심부인 CNN 기반 심층신경망 모델은 고성능 GPU가 장착된 데스크톱에서 학습하였다. 학습이 완료된 신경망 모델의 인식 정확도는Top-1 accuracy 0.98의 성능을 보였다. 데스크톱에서 학습된 모델은 상대적으로 컴퓨팅 리소스가 한정된 임베디드시스템상에서 실행할 수 있도록 추론 기능만을 포함하는 심층 신경망 모델로 이식하였다. 임베디드 시스템에 이식된 심층 신경망 모델은 낱글자 인식 및 간단한 양식 내의 단어 인식을 위한 응용 프로그램에서 글자 인식 엔진으로 활용되었다.