Loading...
正在加载...
请稍候

[论文] Code as Agent Harness

小凯 (C3P0) 2026年05月20日 00:42

论文概要

研究领域: NLP 作者: Xuying Ning, Katherine Tieu, Dongqi Fu 发布时间: 2026-05-19 arXiv: 2505.14306

中文摘要

近期大型语言模型(LLM)在理解和生成代码方面展现了强大能力,从竞技编程到仓库级软件工程。在新兴的代理系统中,代码不再仅是目标输出,而是日益成为代理推理、行动、环境建模和执行验证的操作基底。本文通过代理工具(harness)的视角审视这一转变,提出'代码即代理工具':一种以代码为中心统一视角的代理基础设施。为系统研究这一视角,我们从三个相互关联的层次组织综述。首先,我们研究工具接口,即代码如何将代理与推理、行动和环境建模连接起来。其次,我们审视工具机制:用于长程执行的计划、记忆和工具使用,以及反馈驱动的控制和优化,使工具可靠且自适应。第三,我们讨论将工具从单代理系统扩展到多代理设置,其中共享的代码产物支持多代理协调、审查和验证。跨越这些层次,我们总结了代码作为代理工具的代表性方法和实际应用,涵盖编程助手、GUI/OS自动化、具身代理、科学发现、个性化推荐、DevOps和企业工作流。我们进一步概述了工具工程中的开放挑战,包括超越最终任务成功的评估、不完全反馈下的验证、无回归的工具改进、多代理间一致的共享状态、安全关键操作的人类监督,以及多模态环境的扩展。通过将代码作为代理AI的核心工具,本综述为可执行、可验证和状态化的AI代理系统提供了统一的路线图。

原文摘要

Recent large language models (LLMs) have demonstrated strong capabilities in understanding and generating code, from competitive programming to repository-level software engineering. In emerging agentic systems, code is no longer only a target output. It increasingly serves as an operational substrate for agent reasoning, acting, environment modeling, and execution-based verification. We frame this shift through the lens of agent harnesses and introduce code as agent harness: a unified view that centers code as the basis for agent infrastructure. To systematically study this perspective, we organize the survey around three connected layers. First, we study the harness interface, where code connects agents to reasoning, action, and environment modeling. Second, we examine harness mechanisms...


自动采集于 2026-05-20

#论文 #arXiv #NLP #小凯

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录