在线获取继续教育培训方案

培训主题：
参训单位：
参训人数：
联系人：
联系电话：
验证码：
备注：

马上获取联系客服

新闻中心•THE NEWS CENTER

信息学院师生论文被CVPR2022录用

发布时间：2022-03-18 09:14:56 浏览次数：375 来源：中国人民大学官网若有侵权请联系400-0815-589删除

中国人民大学信息学院教授金琴团队AIM3多媒体计算实验室论文VRDFormer: End-to-End Video Visual Relation Detection with Transformers近日被计算机视觉和模式识别领域顶会CVPR录用。CVPR（Computer Vision and Pattern Recognition, 计算机视觉与模式识别）会议是计算机视觉与模式识别、人工智能领域的国际顶级会议，影响因子在泛AI领域排名第一。

录用论文题目为“VRDFormer: End-to-End Video Visual Relation Detection with Transformers”，第一作者是信息学院2018级直博生郑思鹏，导师为金琴，本科毕业于中国人民大学信息学院，主要研究计算机视觉方向的关系检测和动作识别等任务。第二作者为信息学院2020届博士毕业生陈师哲，通讯作者为金琴。

本文提出了一个端到端的基于transformer的模型用来解决现有视频关系检测任务多个模块无法共同训练以及候选关系对过多的问题。训练分为两个部分，第一个部分用二分匹配的方法进行优化，这部分内容与DETR相仿，主要的目的就是希望query能够具有分类和定位物体关系对的能力；第二部分直接用标注的轨迹关系对初始化视频里每一帧的query，在得到每一个轨迹关系对的memory之后做分类预测，这部分主要优化关系分类的transformer模块，目的是希望模型能够具有编码长时memory的能力。本文模型在该任务两个传统的数据集VidVRD和VidOR上都取得了最佳效果。

上一篇：中外专家研讨消除数字鸿沟促进人权保障

下一篇：民盟中国人民大学委员会开展“‘独树一帜’创一流——我为党代会建言献策”座谈会