ETRI-Knowledge Sharing Plaform

KOREAN
논문 검색
Type SCI
Year ~ Keyword

Detail

Journal Article 자유대화의 음향적 특징 및 언어적 특징 기반의 성인과 노인 분류 성능 비교
Cited - time in scopus Download 301 time Share share facebook twitter linkedin kakaostory
Authors
한승훈, 강병옥, 동성희
Issue Date
2023-08
Citation
정보처리학회논문지. 소프트웨어 및 데이터 공학, v.12, no.8, pp.365-370
ISSN
2287-5905
Publisher
한국정보처리학회
Language
Korean
Type
Journal Article
DOI
https://dx.doi.org/10.3745/KTSDE.2023.12.8.365
Abstract
사람은 노화과정에 따라 발화의 호흡, 조음, 높낮이, 주파수, 언어 표현 능력 등이 변화한다. 본 논문에서는 이러한 변화로부터 발생하는 음향적, 언어적 특징을 기반으로 발화 데이터를 성인과 노인 두 그룹으로 분류하는 성능을 비교하고자 한다. 음향적 특징으로는 발화 음성의 주파수 (frequency), 진폭(amplitude), 스펙트럼(spectrum)과 관련된 특징을 사용하였으며, 언어적 특징으로는 자연어처리 분야에서 우수한 성능을 보이고 있는 한국어 대용량 코퍼스 사전학습 모델인 KoBERT를 통해 발화 전사문의 맥락 정보를 담은 은닉상태 벡터 표현을 추출하여 사용하였다. 본 논문에서는 음향적 특징과 언어적 특징을 기반으로 학습된 각 모델의 분류 성능을 확인하였다. 또한, 다운샘플링을 통해 클래스 불균형 문제를 해소한 뒤 성인과 노인 두 클래스에 대한 각 모델의 F1 점수를 확인하였다. 실험 결과로, 음향적 특징을 사용하였을 때보다 언어적 특징을 사용하였을 때 성인과 노인 분류에서 더 높은 성능을 보이는 것으로 나타났으며, 클래스 비율이 동일하더라도 노인에 대한 분류 성능보다 성인에 대한 분류 성능이 높음을 확인하였다.
This work is distributed under the term of Creative Commons License (CCL)
(CC BY NC)
CC BY NC