등록
생성 모델 기반 데이터 증강 기법을 활용한 딥러닝 기반 감정음성합성 장치 및 방법
- 발명자
-
장인선, 강홍구, 강현주, 권오성, 안충현, 최지훈, 서정일, 양승준
- 출원번호
-
10-2018-0124925 (2018.10.19)
KIPRIS
- 공개번호
-
10-2020-0044337 (2020.04.29)
- 등록번호
- 10-2505927-0000 (2023.02.27)
- 출원국
- 대한민국
- 협약과제
-
18HR3400, 시청각장애인 방송접근권 향상을 위한 디지털자막·음성해설 서비스 기술 개발,
안충현
- 초록
- 본 발명은 음성 합성을 수행하는 방법 및 장치에 대한 것으로, 보다 상세하게는 유사 증강 데이터를 생성하여 음성합성 모델을 훈련하고, 유사 증강 데이터를 생성하는 경우 유사데이터 생성모델(generative model)에 상기 감정 조절 벡터를 입력하여 유사 증강 데이터를 생성하는 것을 포함한다.
- KSP 제안 키워드
- Data Augmentation, Learning-based, Text-To-Speech(TTS), deep learning(DL), generative models, model-based