ETRI-Knowledge Sharing Plaform

KOREAN
특허 검색
Status Country
Year ~ Keyword

Detail

Registered Deep learning-based emotional text-to-speech apparatus and method using generative model-based data augmentation

생성 모델 기반 데이터 증강 기법을 활용한 딥러닝 기반 감정음성합성 장치 및 방법
이미지 확대
Inventors
Jang Inseon, 강홍구, 강현주, 권오성, Ahn Chung Hyun, Yang Seung Jun, Jeongil Seo, Choi Ji Hoon
Application No.
10-2018-0124925 (2018.10.19) KIPRIS
Publication No.
10-2020-0044337 (2020.04.29)
Registration No.
10-2505927-0000 (2023.02.27)
Country
KOREA
Project Code
18HR3400, Development of assistive broadcasting tehcnology for invisible and deaf people's media accessibility, Ahn Chung Hyun
Abstract
본 발명은 음성 합성을 수행하는 방법 및 장치에 대한 것으로, 보다 상세하게는 유사 증강 데이터를 생성하여 음성합성 모델을 훈련하고, 유사 증강 데이터를 생성하는 경우 유사데이터 생성모델(generative model)에 상기 감정 조절 벡터를 입력하여 유사 증강 데이터를 생성하는 것을 포함한다.
KSP Keywords
Data Augmentation, Learning-based, Text-To-Speech(TTS), deep learning(DL), generative models, model-based