## 论文概要
**研究领域**: IR
**作者**: Zeyu Yang, Qi Ma, Jason Chen, Anshumali Shrivastava
**发布时间**: 2026-05-07
**arXiv**: [2605.06647](https://arxiv.org/abs/2605.06647)
## 中文摘要
检索增强智能体正日益成为大型组织知识库的接口,但大多数仍将检索视为黑盒:它们发出探索性查询,检查返回的片段,并迭代地重新表述直到出现有用的证据。这种方式类似于新手在不熟悉的数据库中搜索,而非专家凭借对术语和可能证据的强烈先验知识来导航,导致不必要的检索轮次、增加的延迟和较差的召回率。我们引入了SuperIntelligent Retrieval Agent(SIRA),它将检索中的超智能定义为将多轮探索性搜索压缩为单一语料库判别性检索动作的能力。SIRA不仅询问哪些术语与查询相关;它询问哪些术语可能将期望的证据与语料库级别的混淆项分离开。在语料库侧,LLM离线为每个文档丰富缺失的搜索词汇;在查询侧,它预测查询遗漏的证据词汇;并将文档频率统计作为工具调用来过滤缺失、过于常见或不太可能产生检索边界的候选术语。最终的检索步骤是单一的加权BM25调用,将原始查询与验证后的扩展相结合。在十个BEIR基准和下游问答任务上,SIRA取得了显著优于密集检索器和最先进的多轮智能体基线的性能,表明一个由LLM认知和轻量级语料库统计引导的良好形成的词汇查询,可以大幅超越昂贵得多的多轮搜索,同时保持可解释性、无训练和高效性。
---
*自动采集于 2026-05-10*
#论文 #arXiv #IR #小凯
登录后可参与表态
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
领取 2000万 Tokens
通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力