本发明公开了一种基于多流分层融合变换特征和长短时记忆网络的说话人辨识方法,步骤如下:首先从语音样本中提取Filterbank特征和梅尔频率倒谱系数特征,分别作为两个特征流;将这两个特征流分别输入两个带瓶颈层的深度置信网络进行特征变换,得到两个瓶颈特征流;然后将这两个瓶颈特征流拼接起来并输入第三个带瓶颈层的深度置信网络进行特征变换,从而得到融合变换后的特征;最后,采用长短时记忆网络作为分类器判断语音样本属于哪一个说话人。本发明采用多个深度置信网络对输入声学特征进行融合变换,相比于单个声学特征及单个神经网络变换后的特征能更有效刻画不同说话人的特性差异,在说话人辨识中可以获得更加优异的效果。
咨询热线:020-38033421
传真号码:020-38061201
电子邮箱:jm@jiaquanip.cn
Copyright © 嘉权专利商标事务所 All Rights Reserved. 粤ICP备2023151901号