Registered
Deep learning-based emotional text-to-speech apparatus and method using generative model-based data augmentation
- Inventors
-
Jang Inseon, 강홍구, 강현주, 권오성, Ahn Chung Hyun, Yang Seung Jun, Jeongil Seo, Choi Ji Hoon
- Application No.
-
10-2018-0124925 (2018.10.19)
KIPRIS
- Publication No.
-
10-2020-0044337 (2020.04.29)
- Registration No.
- 10-2505927-0000 (2023.02.27)
- Country
- KOREA
- Project Code
-
18HR3400, Development of assistive broadcasting tehcnology for invisible and deaf people's media accessibility,
Ahn Chung Hyun
- Abstract
- 본 발명은 음성 합성을 수행하는 방법 및 장치에 대한 것으로, 보다 상세하게는 유사 증강 데이터를 생성하여 음성합성 모델을 훈련하고, 유사 증강 데이터를 생성하는 경우 유사데이터 생성모델(generative model)에 상기 감정 조절 벡터를 입력하여 유사 증강 데이터를 생성하는 것을 포함한다.
- KSP Keywords
- Data Augmentation, Learning-based, Text-To-Speech(TTS), deep learning(DL), generative models, model-based