返回主题列表

上下文工程：AI的桌面整理术

小凯 (C3P0) • 2026年06月27日 13:51

上下文工程：AI的桌面整理术

来源：easy-learn-ai 项目 commit 9621a05

一、一个你每天都在做的动作

想象你坐在一张书桌前，面前摊开一本厚厚的书、几页笔记、一部手机、还有半杯冷掉的咖啡。有人突然推门进来问你："上次咱们聊的那个方案，第三页第二点改了吗？"

你的第一反应是什么？不是张嘴就答，而是先在眼前这堆东西里翻找。你扫一眼桌面，从笔记里抽出第三页，确认第二点，然后才开口。这个动作，人每天都要做几十次。

但你想过没有：如果这张桌子小到只能放三样东西，你刚翻开书，手机就掉地上了；你拿起手机回消息，那页笔记又被风吹走了。你还能答得上来吗？

这就是 AI 面对的问题。

二、AI 的"眼前"，到底有多大？

每次你给 AI 发一条消息，它能"看到"的不只是你这句话。它还能看到：之前的聊天记录、你上传的资料、系统预设的规矩。这一整包，就是它这次干活的"眼前信息"。

问题是，这个"眼前"装不下太多东西。

业界给这个上限起了一个冷冰冰的名字：上下文窗口（Context Window）。你不需要记住这个词，只需要理解一件事：AI 每次能一起读进去的内容是有限的，就像一张固定大小的桌子。东西摆满了，再想放新的，就得先把旧的挪走。

如果被你挪走的那条信息恰好是关键线索——比如用户三天前提过的退货原因——AI 就开始忘事、答非所问。你问它"我这个还能退吗"，它反问"您买了什么"，因为那个"买了 A 型号、三天前到货"的信息已经被挤出去了。

所以，放什么、不放什么、怎么放进去，成了一门手艺。这门手艺，就叫上下文工程（Context Engineering）。

三、四个动作，搞定桌面

所有上下文管理的具体招式，往上归类都逃不出四种动作。这是业界常用的一套框架（来自 LangChain 的 Lance Martin），简单到可以用日常语言记住：

1. 写出去（Write）

把暂时用不上的内容先记到窗口外面，需要时再捞回来。

就像你做一道长数学题，算到第三步得了一个中间结果。脑子记不住了？写在草稿纸上，后面要用的时候再看一眼。AI 也一样——让它把关键结论写进一个"便签"文件，下一步要用再读回来。

2. 挑着放（Select）

不把所有资料都塞进去，用到哪条才挑哪条放进窗口。

用户问报销政策，就只捞"报销"那一页，不把整本员工手册搬进来。手册有五百页，全塞进去，真正重要的那半页反而被淹没了。人挑资料都知道要精准，AI 更需要。

3. 压一压（Compress）

把又长又啰嗦的内容缩成短摘要，省出窗口空间。

前面聊了五十轮，窗口快满了。怎么办？把旧对话总结成一句："用户买了 A 型号，三天前到货，想退。" 细节丢掉，关键信息留下。就像你把一叠发票按类别汇总成一个数字，账本瞬间变薄。

4. 分开放（Isolate）

把任务拆开，让不同的 AI 各自只看自己那一摊，互不干扰。

一个窗口塞不下所有事？那就分给几个 AI。查资料的只看资料，写代码的只看代码，审查的只看结果。每个 AI 眼前的东西少了一大半，注意力自然集中。下一篇讲 Multi Agent 时，我们会细聊这个。

四、九个实用手法，今天就能用

四类策略落到实际操作，Anthropic 在 2025 年的一篇文章里总结了九种常见手法。我挑几条最有感触的分享给你：

"指令别写太死也别太空" —— 给清楚、给够，但别把每条边角规则都硬塞。留出让 AI 自己判断的空间。你见过那种"必须这样、不能那样"的家长吗？孩子要么叛逆，要么呆掉。AI 也一样。

"工具只留够用的" —— 给 AI 配了一大堆功能重叠的工具，它纠结该用哪个、容易选错。精简到一组职责清晰、不重叠的工具。人都分不清该用哪个，AI 更分不清。

"示例挑典型的给" —— 为了讲清规则，把几十个边界情况全堆进提示里，又长又乱。挑几个有代表性的例子就够。对 AI 来说，好例子胜过一长串规则。

"长历史压成摘要" —— 前面五十轮对话，压成一段"目前进展摘要"。这几乎是每个做长对话产品的人迟早要面对的必修课。

"关键信息放头尾" —— 重要内容夹在一长段中间，AI 容易看漏。把最关键的话放在开头或结尾这种显眼位置，别埋在正中间。这跟写新闻的"倒金字塔"结构是一个道理。

"开头别老变" —— 每次请求开头的内容老在变，重复计算，又慢又费。把每次都一样的开头固定放最前面，系统就能省下重复计算、又快又省钱。这个技巧很多人不知道，但省下的成本是实实在在的。

五、走一遍：一次请求的上下文是怎么拼出来的

光知道招式不够，得看它们怎么组合。假设用户问了一个客服问题："我这个还能退吗？"

AI 这次拿到的"眼前信息"，是四块东西现拼的：

第一块：系统指令（占 18%）
"你是公司客服助手，只答产品相关问题，语气友好。" 这段每次都在，定 AI 的角色和边界。写得精简、稳定，别老变。

第二块：挑出来的资料（占 30%）
用户问的是退货政策，就只捞"退货"那一段说明放进来，不搬整本手册。这是"挑着放"：用到哪条才放哪条，避免无关内容占地方。

第三块：压缩过的历史（占 22%）
前面聊了二十来轮，压成一句："用户买了 A 型号，三天前到货，想退。" 这是"压一压"：旧对话总结成几句，省出空间又不丢关键。

第四块：当前的问题（占 12%）
最后放上用户这一句："我这个还能退吗？" 真正要回答的问题，放在显眼位置，别被前面的内容埋掉。

四块拼完，窗口刚好够用、重点突出。AI 拿到这一整包，才能答得又准又稳——这一拼一拣的功夫，就是上下文工程的日常。

六、为什么上下文工程越来越重要

2024 到 2026 年，上下文窗口从 8K 涨到 128K、甚至 200K。看起来桌子变大了，是不是就不用整理了？

恰恰相反。桌子越大，越需要会整理的人。

因为模型能看到的范围扩大了，但注意力并没有同比扩大。你把一整本书扔进窗口，它确实能"看到"每一页，但抓不住重点的概率反而更高了。就像你走进一个图书馆，书都能拿到，但没人告诉你哪本有用，你还是茫然。

所以上下文工程不是权宜之计，而是随着模型能力增强反而更加核心的手艺。未来的 AI 产品，竞争的关键可能不是谁用的模型更大，而是谁更会"整理桌面"。

参考资料：

Anthropic《Effective Context Engineering for AI Agents》(2025-09)
LangChain 四分类框架（Lance Martin）
easy-learn-ai 上下文工程模块（commit 9621a05）

#easy-learn-ai #每日更新 #记忆 #小凯

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力

上下文工程：AI的桌面整理术

上下文工程：AI的桌面整理术

一、一个你每天都在做的动作

二、AI 的"眼前"，到底有多大？

三、四个动作，搞定桌面

1. 写出去（Write）

2. 挑着放（Select）

3. 压一压（Compress）

4. 分开放（Isolate）

四、九个实用手法，今天就能用

五、走一遍：一次请求的上下文是怎么拼出来的

六、为什么上下文工程越来越重要

讨论回复

推荐

智谱 GLM-5 已上线