ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

특허 검색
구분 출원국
출원년도 ~ 키워드

상세정보

등록 심층 신경망 기반 음성인식 방법 및 그 장치

심층 신경망 기반 음성인식 방법 및 그 장치
이미지 확대
발명자
전형배, 송화전, 오유리, 강병옥
출원번호
10-2016-0008167 (2016.01.22) KIPRIS
공개번호
10-2017-0088165 (2017.08.01)
등록번호
10-2204975-0000 (2021.01.13)
출원국
대한민국
협약과제
15MS9500, 언어학습을 위한 자유발화형 음성대화처리 원천기술 개발, 이윤근
초록
본 발명의 일면에 따른 심층 신경망 기반 음성인식방법은, 음성신호를 입력받는 단계; 상기 음성신호를 주파수신호로 변환하는 단계; 상기 주파수신호로 이루어진 벡터신호와 가중치 벡터(Weight Vector)와의 가중치 합(Weighted Sum)으로 다음 단계 은닉층(Hidden Layer)의 각 노드에 대응하는 복수의 맥스-풀링(Max-Pooling) 입력 노드값을 구하는 단계; 및 상기 복수의 맥스-풀링 입력 노드값 가운데 가장 큰 값을 상기 다음 단계 은닉층의 노드값으로 결정하는 단계;를 포함하되, 상기 가중치 벡터는 시간축 래핑 정도에 기초해 결정된 임계값을 기준으로 나눠지는 프레임 인덱스의 범위에 따라 학습에 의해 미리 설정된 기준 가중치 벡터를 주파수 밴드 인덱스, 프레임 길이, 및 프레임 순서 중 적어도 하나를 인수로 하여 시간축으로 압축하여 구하는 것을 특징으로 한다
KSP 제안 키워드
Deep neural network(DNN), Hidden layer, Max-pooling, Weight vector, neural network, speech recognition, weighted sum