本发明提供一种基于纯净语音与背景噪声两极建模的音频类型检测方法,包括步骤:S1、构建纯净语音GMM模型以及纯粹背景噪声GMM模型;S2、计算纯净语音模型自身各高斯混元间的距离,判断高斯混元是否位于特征重叠空间;S3、剔除位于特征重叠空间中的高斯混元,重新构建纯净语音统计模型、纯粹背景噪声统计模型;S4、计算新的纯净语音统计模型、纯粹背景噪声统计模型的概率,以及估算音频样本信噪比;S5、根据计算得到的概率以及估算信噪比,构建特征矢量且利用SVM模型进行判决,将样本判别为纯净语音、背景噪声或含噪声语音。本发明在降低GMM?SVM运算量的同时,能有效地区分纯净语音、纯净背景噪声和含噪声语音。
咨询热线:020-38033421
传真号码:020-38061201
电子邮箱:jm@jiaquanip.cn
Copyright © 嘉权专利商标事务所 All Rights Reserved. 粤ICP备2023151901号