ETRI-Knowledge Sharing Plaform

KOREAN
특허 검색
Status Country
Year ~ Keyword

Detail

Registered METHOD AND APPARATUS FOR SPEECH RECOGNITION USING DEEP NEURAL NETWORK

심층 신경망 기반 음성인식 방법 및 그 장치
이미지 확대
Inventors
Jeon Hyung-Bae, Hwa Jeon Song, Yoo Rhee Oh, Kang Byung Ok
Application No.
10-2016-0008167 (2016.01.22) KIPRIS
Publication No.
10-2017-0088165 (2017.08.01)
Registration No.
10-2204975-0000 (2021.01.13)
Country
KOREA
Project Code
15MS9500, Core technology development of the spontaneous speech dialogue processing for the language learning, Lee Yunkeun
Abstract
본 발명의 일면에 따른 심층 신경망 기반 음성인식방법은, 음성신호를 입력받는 단계; 상기 음성신호를 주파수신호로 변환하는 단계; 상기 주파수신호로 이루어진 벡터신호와 가중치 벡터(Weight Vector)와의 가중치 합(Weighted Sum)으로 다음 단계 은닉층(Hidden Layer)의 각 노드에 대응하는 복수의 맥스-풀링(Max-Pooling) 입력 노드값을 구하는 단계; 및 상기 복수의 맥스-풀링 입력 노드값 가운데 가장 큰 값을 상기 다음 단계 은닉층의 노드값으로 결정하는 단계;를 포함하되, 상기 가중치 벡터는 시간축 래핑 정도에 기초해 결정된 임계값을 기준으로 나눠지는 프레임 인덱스의 범위에 따라 학습에 의해 미리 설정된 기준 가중치 벡터를 주파수 밴드 인덱스, 프레임 길이, 및 프레임 순서 중 적어도 하나를 인수로 하여 시간축으로 압축하여 구하는 것을 특징으로 한다
KSP Keywords
Deep neural network(DNN), Hidden layer, Max-pooling, Weight vector, neural network, speech recognition, weighted sum