基于多特征融合和时空注意力机制相结合的视频描述方法--专利交易--嘉权专利商标事务所

申请号：CN2018101102871

申请日：2018-02-05

公开号：

公开日：

授权日：

授权公告日：

所属类型：发明专利

国别省市：

发明名称：基于多特征融合和时空注意力机制相结合的视频描述方法

国际分类号：

范畴分类号：

发明人：华南理工大学

法律状态：已授权

交易方式：

本发明公开了一种基于多特征融合和时空注意力机制相结合的视频描述方法，首先对待描述视频提取多种基于卷积神经网络的特征，包括物体、场景、行为动作以及光流等特征，并将这些特征融合拼接成一个特征向量，然后基于时空注意力机制的双向长短时记忆网络确定视频的语义编码表达，最后输入到单向长短时记忆网络模型进行特征解码，从而获得与所述视频对应的自然语言描述句子。本发明对待描述视频分别提取了物体、场景以及运动特征，表征了视频的对象信息与对象之间的关系以及运动信息，同时考虑到视频在空间维度和时间维度上的变化，利用3D卷积特征进一步捕捉到视频流的运动信息。

4000-268-228