一种基于多流分层融合变换特征和长短时记忆网络的说话人辨识方法--专利交易--嘉权专利商标事务所

申请号：CN2018104930262

申请日：2018-05-22

公开号：

公开日：

授权日：

授权公告日：

所属类型：发明专利

国别省市：

发明名称：一种基于多流分层融合变换特征和长短时记忆网络的说话人辨识方法

国际分类号：

范畴分类号：

发明人：华南理工大学

法律状态：已授权

交易方式：

本发明公开了一种基于多流分层融合变换特征和长短时记忆网络的说话人辨识方法，步骤如下：首先从语音样本中提取Filterbank特征和梅尔频率倒谱系数特征，分别作为两个特征流；将这两个特征流分别输入两个带瓶颈层的深度置信网络进行特征变换，得到两个瓶颈特征流；然后将这两个瓶颈特征流拼接起来并输入第三个带瓶颈层的深度置信网络进行特征变换，从而得到融合变换后的特征；最后，采用长短时记忆网络作为分类器判断语音样本属于哪一个说话人。本发明采用多个深度置信网络对输入声学特征进行融合变换，相比于单个声学特征及单个神经网络变换后的特征能更有效刻画不同说话人的特性差异，在说话人辨识中可以获得更加优异的效果。

4000-268-228