近日,全球计算机视觉领域顶级学术会议——European Conference on Computer Vision (ECCV 2024)在意大利米兰落幕。我校信息工程学院智能媒体处理课题组两篇研究论文在大会发表。
宁纪锋教授课题组的轻量化目标跟踪研究“Exploring the Feature Extraction and Relation Modeling For Light-Weight Transformer Tracking”在会上发表。该研究聚焦轻量级Transformer模型在目标跟踪任务中的特征提取与关系建模问题。提出了一种新的轻量化目标跟踪模型——FERMT(Feature Extraction and Relation Modeling Tracker),通过将传统的注意力机制分解为四个独立子模块,显著提升了视觉跟踪的速度和精度。该模型引入了双重注意力单元(Dual Attention Unit),增强了特征表示能力。实验结果表明,FERMT在GOT-10k数据集上取得了69.6%的平均重叠率(AO),相比当前领先的实时跟踪器在准确率上提升了5.6%,同时在CPU上的跟踪速度提升了54%。
FERMT跟踪模型框架图
唐晶磊副教授课题组的模型压缩研究“Straightforward Layer-wise Pruning for More Efficient Visual Adaptation”在会上发表。该研究专注于模型压缩与高效迁移学习的前沿课题,提出了一种全新的层剪枝方法——SLS(Straightforward Layer-wise Pruning),该方法通过创新的特征评估机制,并结合t-SNE聚类技术,对高效参数迁移模型进行剪枝,有效解决了跨域任务中模型性能与效率之间的平衡问题。实验表明,SLS在保证模型性能的前提下,显著减少了参数存储开销,提升了模型计算效率,尤其在多任务场景中表现突出。
SLS方法示意框架图
ECCV大会作为全球计算机视觉领域的重要平台,吸引了众多国际顶尖学者的参与。我校硕士生韩锐孜和郑继凯代表课题组参会,并在会上展示了课题组的最新研究成果。
ECCV是全球计算机视觉领域的三大顶级学术会议之一,在全球计算机视觉领域有着很强的学术影响力。ECCV大会作为全球计算机视觉领域的重要平台,吸引了众多国际顶尖学者的参与,2024年ECCV论文录用率仅为18%,创下了新低。我校硕士生韩锐孜和郑继凯代表课题组参会,并在会上展示了课题组的最新研究成果,彰显了我校在国际计算机视觉领域的科研实力与学术影响力。
编辑:王学锋
终审:徐海