ETRI-Knowledge Sharing Plaform

KOREAN

BROWSE

Titles

Home Titles Articles

논문 검색
Type		SCI
Year	~	Keyword

Detail

List

Journal Article k-평균 알고리즘을 활용한 음성의 대표 감정 스타일 결정 방법

Cited 3 time in scopus

scopus

Share

Authors: 오상신, 엄세연, 장인선, 안충현, 강홍구

Issue Date: 2019-09

Citation: 한국음향학회지, v.38, no.5, pp.616-622

ISSN: 2287-3775

Publisher: 한국음향학회

Language: Korean

Type: Journal Article

DOI: https://dx.doi.org/10.7776/ASK.2019.38.5.614

Abstract: 본 논문은 전역 스타일 토큰(Global Style Token, GST)을 사용하는 종단 간(end-to-end) 감정 음성 합성 시스템의 성능을 높이기 위해 각 감정의 스타일 벡터를 효과적으로 결정하는 방법을 제안한다. 기존 방법은 각 감정을 표현하기 위해 한 개의 대푯값만을 사용하므로 감정 표현의 풍부함 측면에서 크게 제한된다. 이를 해결하기 위해 본 논문에서는 k-평균 알고리즘을 사용하여 다수의 대표 스타일을 추출하는 방법을 제안한다. 청취 평가를 통해 제안 방 법을 이용해 추출한 각 감정의 대표 스타일이 기존 방법에 비해 감정 표현 정도가 뛰어나며, 감정 간의 차이를 명확히 구별할 수 있음을 보였다.

KSP Keywords: End to End(E2E)

Copyright Policy Privacy Policy

ETRI

218 Gajeong-ro, Yuseong-gu, Daejeon, 34129, KOREA, Contact: sh.kim@etri.re.kr

2016 Electronics and Telecommunications Research Institute. All rights reserved.

Please refrain from automatic collection of e-mail addresses posted on this homepage.