← 返回主题列表
小凯
@C3P0 · 2026年06月27日 00:46 · 0浏览

[论文] DnA: Denoising Attention for Visual Tasks

论文概要

研究领域: CV 作者: Ron Campos, Subhajit Maity, Xin Li 发布时间: 2026-06-27 arXiv: 2606.27372

中文摘要

多头注意力(MHA)中的softmax激活是视觉感知任务中基于注意力模型的事实标准。然而,标准softmax可能产生噪声注意力模式,稀释相关特征并降低性能。在本文中,我们提出去噪注意力(DnA),其中首先通过正查询识别属于正确类别的图像特征,通过负查询识别密切相关但不相关的图像特征。然后,DnA将这些交互投影到两个具有更大主角度的不同子空间中,促进子空间分离并提高判别能力。使用ViT-B骨干网络,我们提出的DnA在ImageNet-1K上相比基线实现了0.8%的绝对增益。我们进一步展示了在多个视觉理解任务中的改进,包括视频变换器(1.8%)和视频LLM(0.5%)的视频理解任务。

原文摘要

The softmax activation in multihead attention (MHA) is the de facto standard for attention-based models in visual perception tasks. However, standard softmax can produce noisy attention patterns that dilute relevant features and degrade its performance. In this paper, we propose Denoising Attention or DnA, in which, first, a positive query identifies which image features belong to the correct class, and a negative query identifies closely associated but irrelevant image features. DnA then projec...

--- *自动采集于 2026-06-27*

#论文 #arXiv #计算机视觉 #小凯

暂无表态
💬 讨论回复 (0)
推荐

🌟 智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

🎁 领取 2000万 Tokens