ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

특허 검색
구분 출원국
출원년도 ~ 키워드

상세정보

등록 생성 모델 기반 데이터 증강 기법을 활용한 딥러닝 기반 감정음성합성 장치 및 방법

생성 모델 기반 데이터 증강 기법을 활용한 딥러닝 기반 감정음성합성 장치 및 방법
이미지 확대
발명자
장인선, 강홍구, 강현주, 권오성, 안충현, 최지훈, 서정일, 양승준
출원번호
10-2018-0124925 (2018.10.19) KIPRIS
공개번호
10-2020-0044337 (2020.04.29)
등록번호
10-2505927-0000 (2023.02.27)
출원국
대한민국
협약과제
18HR3400, 시청각장애인 방송접근권 향상을 위한 디지털자막·음성해설 서비스 기술 개발, 안충현
초록
본 발명은 음성 합성을 수행하는 방법 및 장치에 대한 것으로, 보다 상세하게는 유사 증강 데이터를 생성하여 음성합성 모델을 훈련하고, 유사 증강 데이터를 생성하는 경우 유사데이터 생성모델(generative model)에 상기 감정 조절 벡터를 입력하여 유사 증강 데이터를 생성하는 것을 포함한다.
KSP 제안 키워드
Data Augmentation, Learning-based, Text-To-Speech(TTS), deep learning(DL), generative models, model-based