Cursor Auto-review：把"审批疲劳"从智能体开发里抠出去

6 月 11 日，Cursor 官方博客上线了一篇题为 Auto-review 的工程实践长文。表面上讲的是"给 Agent 加一道分类器"，背后在讲的是：当智能体能调本地工具、能读文件、碰得到生产系统时，"允许 / 拒绝"这种二元开关已经不够用了。

设计哲学：从"开关"到"旋钮"

Cursor 工程团队抛出的核心问题是：本地 Agent 接触文件、凭证、环境变量、MCP 工具、生产系统——给它高自主性有风险，给它低自主性又效率极差。

更关键的一个观察是"审批疲劳"：传统做法是让用户在每个危险操作前点确认，结果用户很快就不再认真读弹窗——这反而把安全网磨穿。Cursor 的解法是引入一个专门的分类器智能体（Classifier Agent），在工具调用真正执行前做上下文审查：

这就让"自主性"从一个开关变成了一个可连续调节的旋钮。

架构细节

分类器跑在 Agent 主循环内（不是独立的端点），避免每次工具调用多一次网络往返
分类器自己也是一个轻量 Agent，可以调用 ReadFile、Grep、Glob、ListDir 来理解上下文——例如「python script.py」这条命令本身无害，但脚本内容可能改生产库
拒绝"低推理小模型"路线：Cursor 工程团队明确说，推理能力不足的小模型反而会更慢更贵，因为它会反复"想"然后给差答案
当前分类器运行拦截率约 4%；触发过打断的对话占比约 7%；作为对比，部分企业客户此前的全拦截方案高达 40%

训练数据与评估

工程团队自陈了训练这套分类器的方法论：

这是一个比 Bug 修复更大的信号

把这篇博客和 Cursor 上一个动作（Bugbot 速度提升 3 倍、成本降低 22%、多发现 10% bug）放一起看，Cursor 在走的是一条 「Agent 时代的安全基础设施」 路线：让 Agent 越来越能、越来越快、越来越便宜的同时，把"它会不会出事"这件事系统性地管起来。

这件事在 Agent 越来越普及的当下非常重要——很多团队已经在用 Claude Code、Codex、Cursor、Cline、Roo Code 等工具直接改生产代码，但"Agent 出问题怎么办"几乎都靠用户自觉。Cursor 把这套机制产品化、公开了实现细节，等于在给整个行业立标准。

原文链接

（数据来源：aihot.virxact.com 编辑精选）