本发明公开了一种基于深度学习的非常态语音区分方法,包括以下步骤,获取输入语音,并对输入语音进行重采样、预加重、分帧加窗预处理,得到预处理语音;对预处理语音提取梅尔频率倒谱系数特征矢量;将不同帧数的语音段规整到固定帧数,每个语音段得到一个对应的梅尔频率倒谱系数特征矩阵;建立卷积深度置信网络;将梅尔频率倒谱系数特征矩阵输入卷积深度置信网络,进行训练,并对输入语音的状态进行分类;根据分类结果,调用隐马尔可夫模型进行模板匹配,得到语音识别结果;本发明利用卷积深度置信网络的多个非线性变换层、将输入的MFCC特征映射到更高维空间,并用隐马尔科夫模型对不同状态的语音分别建模,提高了语音的识别准确性。
咨询热线:020-38033421
传真号码:020-38061201
电子邮箱:jm@jiaquanip.cn
Copyright © 嘉权专利商标事务所 All Rights Reserved. 粤ICP备2023151901号