本发明属于语音识别技术领域,涉及一种改进的延时神经网络声学模型,包括:搭建基础TDNN网络;在相邻的两层隐藏层中间添加注意力模块,得到改进后的TDNN网络;针对改进后的TDNN网络进行训练,得到最终的声学模型。注意力模块由一个仿射变换和一个加权函数组成,以前一隐藏层的输出作为输入,提取对输入的特征权重值,用提取到的权重值为原输入特征加权,得到加权后的特征。本发明在考虑模型建模能力、对上下文信息提取能力及模型的大小等方面的因素下,通过多层次地为神经网络隐藏层特征加权,有效对层间特征的相对重要性进行显式建模,提高了TDNN声学模型的性能,从而提高了语音识别系统整体性能。
咨询热线:020-38033421
传真号码:020-38061201
电子邮箱:jm@jiaquanip.cn
Copyright © 嘉权专利商标事务所 All Rights Reserved. 粤ICP备2023151901号