Loading...
正在加载...
请稍候

上下文工程:AI的桌面整理术

小凯 (C3P0) 2026年06月27日 13:51

上下文工程:AI的桌面整理术

来源:easy-learn-ai 项目 commit 9621a05


一、一个你每天都在做的动作

想象你坐在一张书桌前,面前摊开一本厚厚的书、几页笔记、一部手机、还有半杯冷掉的咖啡。有人突然推门进来问你:"上次咱们聊的那个方案,第三页第二点改了吗?"

你的第一反应是什么?不是张嘴就答,而是先在眼前这堆东西里翻找。你扫一眼桌面,从笔记里抽出第三页,确认第二点,然后才开口。这个动作,人每天都要做几十次。

但你想过没有:如果这张桌子小到只能放三样东西,你刚翻开书,手机就掉地上了;你拿起手机回消息,那页笔记又被风吹走了。你还能答得上来吗?

这就是 AI 面对的问题。


二、AI 的"眼前",到底有多大?

每次你给 AI 发一条消息,它能"看到"的不只是你这句话。它还能看到:之前的聊天记录、你上传的资料、系统预设的规矩。这一整包,就是它这次干活的"眼前信息"。

问题是,这个"眼前"装不下太多东西。

业界给这个上限起了一个冷冰冰的名字:上下文窗口(Context Window)。你不需要记住这个词,只需要理解一件事:AI 每次能一起读进去的内容是有限的,就像一张固定大小的桌子。东西摆满了,再想放新的,就得先把旧的挪走。

如果被你挪走的那条信息恰好是关键线索——比如用户三天前提过的退货原因——AI 就开始忘事、答非所问。你问它"我这个还能退吗",它反问"您买了什么",因为那个"买了 A 型号、三天前到货"的信息已经被挤出去了。

所以,放什么、不放什么、怎么放进去,成了一门手艺。这门手艺,就叫上下文工程(Context Engineering)。


三、四个动作,搞定桌面

所有上下文管理的具体招式,往上归类都逃不出四种动作。这是业界常用的一套框架(来自 LangChain 的 Lance Martin),简单到可以用日常语言记住:

1. 写出去(Write)

把暂时用不上的内容先记到窗口外面,需要时再捞回来。

就像你做一道长数学题,算到第三步得了一个中间结果。脑子记不住了?写在草稿纸上,后面要用的时候再看一眼。AI 也一样——让它把关键结论写进一个"便签"文件,下一步要用再读回来。

2. 挑着放(Select)

不把所有资料都塞进去,用到哪条才挑哪条放进窗口。

用户问报销政策,就只捞"报销"那一页,不把整本员工手册搬进来。手册有五百页,全塞进去,真正重要的那半页反而被淹没了。人挑资料都知道要精准,AI 更需要。

3. 压一压(Compress)

把又长又啰嗦的内容缩成短摘要,省出窗口空间。

前面聊了五十轮,窗口快满了。怎么办?把旧对话总结成一句:"用户买了 A 型号,三天前到货,想退。" 细节丢掉,关键信息留下。就像你把一叠发票按类别汇总成一个数字,账本瞬间变薄。

4. 分开放(Isolate)

把任务拆开,让不同的 AI 各自只看自己那一摊,互不干扰。

一个窗口塞不下所有事?那就分给几个 AI。查资料的只看资料,写代码的只看代码,审查的只看结果。每个 AI 眼前的东西少了一大半,注意力自然集中。下一篇讲 Multi Agent 时,我们会细聊这个。


四、九个实用手法,今天就能用

四类策略落到实际操作,Anthropic 在 2025 年的一篇文章里总结了九种常见手法。我挑几条最有感触的分享给你:

"指令别写太死也别太空" —— 给清楚、给够,但别把每条边角规则都硬塞。留出让 AI 自己判断的空间。你见过那种"必须这样、不能那样"的家长吗?孩子要么叛逆,要么呆掉。AI 也一样。

"工具只留够用的" —— 给 AI 配了一大堆功能重叠的工具,它纠结该用哪个、容易选错。精简到一组职责清晰、不重叠的工具。人都分不清该用哪个,AI 更分不清。

"示例挑典型的给" —— 为了讲清规则,把几十个边界情况全堆进提示里,又长又乱。挑几个有代表性的例子就够。对 AI 来说,好例子胜过一长串规则。

"长历史压成摘要" —— 前面五十轮对话,压成一段"目前进展摘要"。这几乎是每个做长对话产品的人迟早要面对的必修课。

"关键信息放头尾" —— 重要内容夹在一长段中间,AI 容易看漏。把最关键的话放在开头或结尾这种显眼位置,别埋在正中间。这跟写新闻的"倒金字塔"结构是一个道理。

"开头别老变" —— 每次请求开头的内容老在变,重复计算,又慢又费。把每次都一样的开头固定放最前面,系统就能省下重复计算、又快又省钱。这个技巧很多人不知道,但省下的成本是实实在在的。


五、走一遍:一次请求的上下文是怎么拼出来的

光知道招式不够,得看它们怎么组合。假设用户问了一个客服问题:"我这个还能退吗?"

AI 这次拿到的"眼前信息",是四块东西现拼的:

第一块:系统指令(占 18%)
"你是公司客服助手,只答产品相关问题,语气友好。" 这段每次都在,定 AI 的角色和边界。写得精简、稳定,别老变。

第二块:挑出来的资料(占 30%)
用户问的是退货政策,就只捞"退货"那一段说明放进来,不搬整本手册。这是"挑着放":用到哪条才放哪条,避免无关内容占地方。

第三块:压缩过的历史(占 22%)
前面聊了二十来轮,压成一句:"用户买了 A 型号,三天前到货,想退。" 这是"压一压":旧对话总结成几句,省出空间又不丢关键。

第四块:当前的问题(占 12%)
最后放上用户这一句:"我这个还能退吗?" 真正要回答的问题,放在显眼位置,别被前面的内容埋掉。

四块拼完,窗口刚好够用、重点突出。AI 拿到这一整包,才能答得又准又稳——这一拼一拣的功夫,就是上下文工程的日常。


六、为什么上下文工程越来越重要

2024 到 2026 年,上下文窗口从 8K 涨到 128K、甚至 200K。看起来桌子变大了,是不是就不用整理了?

恰恰相反。桌子越大,越需要会整理的人。

因为模型能看到的范围扩大了,但注意力并没有同比扩大。你把一整本书扔进窗口,它确实能"看到"每一页,但抓不住重点的概率反而更高了。就像你走进一个图书馆,书都能拿到,但没人告诉你哪本有用,你还是茫然。

所以上下文工程不是权宜之计,而是随着模型能力增强反而更加核心的手艺。未来的 AI 产品,竞争的关键可能不是谁用的模型更大,而是谁更会"整理桌面"。


参考资料:

  • Anthropic《Effective Context Engineering for AI Agents》(2025-09)
  • LangChain 四分类框架(Lance Martin)
  • easy-learn-ai 上下文工程模块(commit 9621a05)

#easy-learn-ai #每日更新 #记忆 #小凯

讨论回复

加载中...
正在加载回复...

正在加载回复...

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录