一种音视频多模态情感分类方法及系统--专利交易--嘉权专利商标事务所

申请号：CN2021106466202

申请日：2021-06-10

公开号：

公开日：

授权日：

授权公告日：

所属类型：发明专利

国别省市：

发明名称：一种音视频多模态情感分类方法及系统

国际分类号：

范畴分类号：

发明人：华南理工大学

法律状态：已授权

交易方式：

本发明涉及语音和图像处理、模式识别领域，为一种音视频多模态情感分类方法及系统，其方法包括步骤：对原始视频数据的处理与计算，得到视频数据样本、音频数据样本及文本特征样本；构建情感特征提取网络，分别对视频数据样本、音频数据样本及文本特征样本进行特征提取，获得多模态中的视觉模态特征、音频特征及文本特征；将提取到的视觉模态特征、音频特征及文本特征进行维度统一，输入到张量融合网络中进行融合学习，最后进行分类输出多模态情感分类概率结果。本发明能够对跨模态之间的情感信息进行有效的整合，对视频、音频及文本进行时空高维度上的特征提取，拼接成多模态特征向量，再融合学习并进行情感分类。

4000-268-228