[论文] BAMI: Training-Free Bias Mitigation in GUI Grounding

论文概要

研究领域: CV 作者: Borui Zhang, Bo Zhang, Bo Wang, Wenzhao Zheng et al. 发布时间: 2026-05-07 arXiv: 2605.06664

中文摘要

GUI定位是使GUI智能体能够执行点击、拖动等任务的关键能力。然而，在ScreenSpot-Pro等复杂场景基准测试中，现有模型往往表现不佳。利用我们提出的掩码预测分布（MPD）归因方法，我们识别出错误的主要来源有两个：高图像分辨率（导致精度偏差）和复杂的界面元素（导致歧义偏差）。为解决这些问题，我们提出了偏差感知操作推理（BAMI），它包含两种关键操作——由粗到细的聚焦和候选选择——以有效缓解这些偏差。大量实验结果表明，BAMI在无训练设置下显著提升了各种GUI定位模型的准确率。例如，将我们的方法应用于TianXi-Action-7B模型，其在ScreenSpot-Pro基准上的准确率从51.9%提升至57.8%。此外，消融研究证实了BAMI方法在不同参数配置下的鲁棒性，凸显了其稳定性和有效性。代码已开源：https://github.com/Neur-IO/BAMI。

原文摘要

见arXiv

--- *自动采集于 2026-05-10*

#论文 #arXiv #CV #小凯

[论文] BAMI: Training-Free Bias Mitigation in GUI Grounding

论文概要

中文摘要

原文摘要

🌟 智谱 GLM-5 已上线