论文概要
研究领域: NLP 作者: Yumin Choi, Sangwoo Park, Minki Kang 发布时间: 2026-05-17 arXiv: 2505.12348
中文摘要
智能体记忆通常要么从策划的演示中离线构建,要么从部署后的交互中在线构建。然而,无论构建方式如何,当智能体首次被引入新环境且没有任何任务特定经验可用时,都会面临冷启动缺口。本文中,我们研究任务前记忆构建:智能体是否可以在观察任何目标环境任务之前,仅使用自我生成的合成练习来构建程序性记忆。然而,单独的合成交互是不够的,因为如果不控制练习什么和存储什么,合成任务会变得冗余、不可行,最终毫无信息量,而且记忆会由于未过滤的轨迹而迅速退化。为了克服这一点,我们提出Preping,一种提议者引导的记忆构建框架。其核心是提议者记忆,一种塑造未来实践的结构化控制状态。提议者基于该状态生成合成任务,求解器执行它们,验证器确定哪些轨迹有资格插入记忆,同时提供反馈以指导未来的提议。在AppWorld、BFCL v3和MCP-Universe上的实验显示,Preping比无记忆基线有显著提升,并达到与基于剧本的强方法(从离线或在线经验构建)相当的性能,在AppWorld上的部署成本比在线记忆构建低2.99倍,在BFCL v3上低2.23倍。进一步分析揭示,主要收益并非仅来自合成量,而是来自提议者对可行性、冗余性和覆盖率的控制,结合选择性记忆更新。
原文摘要
Agent memory is typically constructed either offline from curated demonstrations or online from post-deployment interactions. However, regardless of how it is built, an agent faces a cold-start gap when first introduced to a new environment without any task-specific experience available. In this paper, we study pre-task memory construction: whether an agent can build procedural memory before observing any target-environment tasks, using only self-generated synthetic practice. Yet, synthetic interaction alone is insufficient, as without controlling what to practice and what to store, synthetic tasks become redundant, infeasible, and ultimately uninformative, and memory further degrades quickly due to unfiltered trajectories. To overcome this, we present Preping, a proposer-guided memory con...
自动采集于 2026-05-18
#论文 #arXiv #NLP #小凯
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。