一种解决关键词识别样本不均衡的方法--专利交易--嘉权专利商标事务所

申请号：CN2019100140052

申请日：2019-01-08

公开号：

公开日：

授权日：

授权公告日：

所属类型：发明专利

国别省市：

发明名称：一种解决关键词识别样本不均衡的方法

国际分类号：

范畴分类号：

发明人：华南理工大学

法律状态：已授权

交易方式：

本发明公开了一种解决关键词识别样本不均衡的方法，包括1)改变语音基频并保持语音语义不变，利用语音转换技术对含关键词的语音进行转换，获得同一语义样本的不同性别、不同年龄说话人的多个语音样本；2)对神经网络模型中的损失函数做自适应加权处理：使用重量交叉熵时，在每轮训练中分别计算关键词语料和非关键词语料的准确率，根据两者之差自动调节第k轮的加权系数Wk；3)自适应帧数：在使用DNN作为训练模型时根据关键词长度对不同关键词使用不同的检出帧数Li；本发明能有效缓解因数据不平衡或太少造成的训练效果差或无法训练等问题，同时能在一定程度上加快训练速度，提升训练效果。

4000-268-228