一种基于随机深度时延神经网络模型的自动语音识别方法--专利交易--嘉权专利商标事务所

申请号：CN2018110910891

申请日：2018-09-19

公开号：

公开日：

授权日：

授权公告日：

所属类型：发明专利

国别省市：

发明名称：一种基于随机深度时延神经网络模型的自动语音识别方法

国际分类号：

范畴分类号：

发明人：华南理工大学

法律状态：已授权

交易方式：

本发明属于自动语音识别技术领域，涉及一种基于随机深度时延神经网络模型的自动语音识别方法，包括：准备训练数据；对训练语音音频数据提取声学特征；训练传统GMM?HMM模型，用训练好的GMM?HMM模型对训练语音音频数据进行强制对齐，得到对应的帧级别训练标注；利用训练语音音频数据和对应的帧级别训练标注，对基于随机深度的时延神经网络模型进行监督训练，最终结合隐马尔科夫模型得到声学模型；利用对应的文本标注数据或者其他数据集的文本进行训练，得到训练好的语言模型；利用训练好的语言模型和声学模型，构建自动语音识别的解码器。本发明不仅提高了模型的建模能力，还解决了训练过程中过拟合以及梯度消失的问题，从而提高了语音识别的准确性。

4000-268-228