首页 > 专利商城 > 专利交易
一种基于多流分层融合变换特征和长短时记忆网络的说话人辨识方法
交易价格:面谈
所属类型
发明专利
所属行业
G10-乐器、声学
所属国家
所属地域
PCT项
交易方式
  • 专利详情
  • 专利摘要
  • 主权利要求
  • 优先权项
  • PCT项
CN2018104930262
2018-05-22
发明专利
一种基于多流分层融合变换特征和长短时记忆网络的说话人辨识方法
华南理工大学
已授权

本发明公开了一种基于多流分层融合变换特征和长短时记忆网络的说话人辨识方法,步骤如下:首先从语音样本中提取Filterbank特征和梅尔频率倒谱系数特征,分别作为两个特征流;将这两个特征流分别输入两个带瓶颈层的深度置信网络进行特征变换,得到两个瓶颈特征流;然后将这两个瓶颈特征流拼接起来并输入第三个带瓶颈层的深度置信网络进行特征变换,从而得到融合变换后的特征;最后,采用长短时记忆网络作为分类器判断语音样本属于哪一个说话人。本发明采用多个深度置信网络对输入声学特征进行融合变换,相比于单个声学特征及单个神经网络变换后的特征能更有效刻画不同说话人的特性差异,在说话人辨识中可以获得更加优异的效果。

联系方式

咨询热线:020-38033421

传真号码:020-38061201

电子邮箱:jm@jiaquanip.cn

关注嘉权专利商标事务所

Copyright © 嘉权专利商标事务所 All Rights Reserved.    粤ICP备2023151901号   Sitemap   XML