创新在大工

【创新在大工】未来技术学院/人工智能学院本科生连发两篇顶级会议论文

2024-03-25作者:孙智妍

近日,来自未来技术学院2020级本科生王宇皓同学的论文《魔法标记:为多模态目标重识别选择多样化的标记》(Magic Tokens: Select Diverse Tokens for Multi-modal Object Re-Identification)被计算机视觉领域顶级会议CVPR2024接收。

CVPR的全称为IEEE Conference on Computer Vision and Pattern Recognition,即IEEE国际计算机视觉与模式识别会议。目前该会议H5指数为422,位列计算机视觉与模式识别影响力榜单第一,也是中国计算机学会(CCF)推荐的A类国际学术会议。CVPR2024将于6月19日至21日在美国西雅图召开。

图1论文海报展示.jpg

王宇皓的论文海报展示

该论文聚焦多模态目标重识别任务,旨在通过利用多模态图像的互补信息来实现跨摄像头下同一目标的检索。论文中提出了一种基于Transformer的特征选择框架,能够实现多模态特征协同选择。在保留不同模态丰富细节的同时,尽可能降低背景干扰。

图2 模型框架示意图.jpg

模型框架示意图

文章链接:https://arxiv.org/abs/2403.10254

此前,王宇皓已以第一作者在人工智能领域顶级会议AAAI2024发表论文《TOP-ReID:基于标记置换的多光谱目标重识别》(TOP-ReID: Multi-spectral Object Re-Identification with Token Permutation)。

AAAI的全称为Association for the Advancement of Artificial Intelligence,即国际先进人工智能协会。它是人工智能领域的主要学术组织之一,其主办的“AAAI Conference on Artificial Intelligence”是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。

该论文聚焦多模态目标重识别任务,主要目的是通过利用多模态图像的互补信息来辅助跨摄像头下同一目标的检索。论文中提出了一种基于Transformer的统一框架,能够同时处理多模态和模态缺失情况下的目标重识别任务。该论文的第一作者是王宇皓,由卢湖川教授、张平平副教授等共同指导完成。

图3 论文中技术框架示意图.jpg

AAAI2024论文中技术框架示意图

文章链接:https://arxiv.org/abs/2312.09612

来源:未来技术学院/人工智能学院
编辑:王一婷 常思萌
审核:王增强