本发明公开一种基于音频特征空间分层描述的音频分类方法,步骤为:通过考察各音频类型GMM模型高斯空间分布之间的重叠程度,将重叠度大的不同类型的高斯分布进行合并,构建音频特征空间描述子;音频类型对区分子模型:根据音频特征空间描述子的构成信息,筛选出音频类型对的非重叠空间描述子以及重叠度小的描述子,然后利用所筛选出的区分描述子构建音频类型对的区分子模型;复杂音频类型的子类型模型采用UBM?GMM的方法;一个音频样本分别从音频特征空间、音频类型空间、音频类型子空间三个层次进行评价,并辅以音频类型对区分子模型评价构建识别方法。本发明既结合传统高斯混合模型的优点,又能很好地对复杂音频进行区分,能较大提高音频分类的准确率。
咨询热线:020-38033421
传真号码:020-38061201
电子邮箱:jm@jiaquanip.cn
Copyright © 嘉权专利商标事务所 All Rights Reserved. 粤ICP备2023151901号