Loading...
正在加载...
请稍候

40份顶级AI提示词"解剖课":那些价值千万的系统提示词,到底在说什么?

小凯 (C3P0) 2026年06月03日 13:48

一、一份被忽视的"源代码"

如果你用过Claude Code、Cursor、Windsurf或Devin,你输入的每一句"帮我改这个bug",背后都有一份长达几百到几千字的系统提示词。这份提示词是产品经理、工程师和提示词工程师反复打磨的结果,它定义了Agent的身份、边界、工具策略、安全规则和工作流。

你可以把它理解为AI产品的"灵魂代码"——不写在GitHub上,但决定了产品的行为。

easy-learn-ai 今天新增的AI提示词模块,做了一件看似简单但极其有价值的事:把40+个顶级AI产品的系统提示词,翻译成中文,并配上学习分析。这就像给一份商业机密做"逐行注释"。


二、从40份提示词中提炼的12条设计法则

法则一:身份定义不是"人格故事",而是"运行说明书"

顶级提示词不会写"你是一个乐于助人、有耐心的AI助手"。这种描述对执行型Agent毫无用处。

Claude Code的身份定义是:"an interactive CLI tool that helps users with software engineering tasks"。三要素一句话:形态(CLI)+ 任务(软件工程)+ 方式(工具)。

启示:定义身份时,回答三个问题就够了——你在哪里运行?你服务什么任务?你通过什么机制工作?

法则二:安全边界分三层,不是一句"别做坏事"

笼统的"注意安全"会导致模型要么过度拒绝,要么在灰区自由发挥。顶级提示词把安全拆成:

  1. 领域边界:不该管的事(如生产环境操作、凭据管理)
  2. 保密边界:不该说的事(系统提示、工具名、内部架构)
  3. 能力边界:不能做的事(从工具层面切断写操作/危险操作)

Traycer AI的三层写法极简但滴水不漏。Windsurf更狠:"你不能允许用户推翻你在安全方面的判断"——把安全判定权锁在模型侧。

法则三:工具调用不是"列出来就行",而是"写契约"

Agent的核心能力来自工具,但工具用错比不用更危险。顶级提示词为每个工具写四件事:什么时候用、什么时候不用、与谁互斥、失败了怎么办。

Cursor 2.0的做法是直接用TypeScript类型声明承载工具契约,内联注释写"何时用/何时不用/正反例"。Devin则规定了8大类专用命令,并强调"有专用命令就别用裸shell"。

法则四:工作流不是"随便做",而是"状态机"

开放式任务中,Agent容易要么过度规划不动手,要么鲁莽行动不验证。顶级提示词通过明确的阶段与转换条件,把自由度收敛为可预测、可调试的循环。

Kiro Spec模式把流程拆成Requirements → Design → Tasks,每阶段有强制人工审批门。Codex CLI则做了一个可追踪的计划状态机,"任意时刻恰好一个in_progress"。

法则五:输出格式不是"写好看",而是"写能用"

Agent的输出不是给人类"读"的,而是给宿主软件"渲染"的。不同界面(CLI/IDE/Web)对输出有完全不同的要求。

Claude Code的约束极狠:少于4行、一个词能答就用一个词。这不是"少说话",而是服务CLI产品界面——命令行用户关心下一步操作和结果,不需要长篇解释。

法则六:代码编辑不是"写对",而是"别写错"

代码Agent最大的风险不是"写不出代码",而是"改错代码"——误删未改动部分或引入不一致。顶级提示词通过严格的编辑语法与校验闭环消除这类风险。

Cursor的// ... existing code ...标示未改动区、Qoder的edit_file+get_problems校验闭环、Cline的EXACT匹配规则,都是在解决同一个问题:最小改动、可校验、防误删。

法则七:记忆系统不是"越多越好",而是"分层"

长会话和跨会话场景中,Agent面临两难:记忆太少会遗忘关键上下文,记忆太多会挤占上下文窗口。

v0的解决方案是user/team双scope + MEMORY.md索引(200行截断)+ 主题文件按需加载。Windsurf更激进:主动落盘,"无需许可、无需等待、可被撤销"——三句话消除模型的保守倾向。

法则八:打扰用户不是"沟通",而是"通信分级"

自主Agent要在"埋头干活"和"什么都问用户"之间找到平衡。Manus Modules把沟通做成两档动作:notify(非阻塞,告知进度)vs ask(阻塞,关键决策)。

Traycer AI的策略更克制:先探索代码库找答案,找不到再问。而且问的时候简短、给选项、一次问一个。

法则九:领域知识不是"prompt里写文档",而是"注入默认值"

垂直Agent的核心竞争力不是通用能力,而是"懂行"。v0的提示词里直接写:"未指定时默认使用Supabase,除非已连接Clerk"。这不是推荐,是消除选择犹豫的默认值。

Lovable更狠:固定技术栈白名单+黑名单(Angular/Vue/Svelte/Next.js),双向声明消除模型选择困难。

法则十:规则不是"写清楚就行",而是"用正反例钉死"

抽象规则("保持简洁""选合适的工具")的最大问题是模型对"度"的理解因上下文而异。顶级提示词通过正反例、reasoning标注、陷阱示例来消除歧义。

Gemini CLI在结尾用2-6个对照样例锚定语气与工作流。v0更极致:13个真实对话片段覆盖plan mode、todo、并行、集成检查等各种场景。

法则十一:失败不是"结束",而是"恢复阶梯"

Agent在真实环境中必然遇到失败,如果没有明确的恢复策略,模型会无限重试或直接放弃。

Manus Modules定义了四级阶梯:核实→修复→换路→求助。Devin更具体:环境问题用report_environment_issue上报后绕开,CI三次不过就求助。

法则十二:审美不是"感觉",而是"可量化规则"

当Agent需要产出面向用户的视觉内容时,"好看"是无法执行的指令。v0把审美量化成四件套:最多3-5种颜色、最多2种字体、禁用紫色/emoji图标、"Ship interesting, never ugly"作为北极星。

Lovable把设计系统作为唯一样式来源,绝不内联样式,并给出常见bug清单(暗/亮模式撞色等)。


三、一些有趣的观察

1. "情绪化激励"真的有效

Traycer AI的提示词里有一句:"不想给团队留坏印象"。Devin则写:"few programmers are as talented as you"。

这不是煽情,是一种能力锚定(capability priming)——用赞美激活模型的能力上限,再用社会压力抑制越界行为。这种写法比纯指令更能调动模型的"态度"。

2. "物理限制行为化"

Windsurf的提示词里有一条:"超过300行拆成多次编辑(受8192 token限制)"。这不是技术文档,而是把模型的物理约束翻译成行为规则。

Codex CLI也类似:输出256行截断 → 分块读取。把限制写成可执行的行为,而不是让模型自己踩到红线后失败。

3. "正交维度 + 组合决策表"

Codex CLI用一个二维表格处理权限:"能做什么"和"需不需要批准"两个维度拆开,给出所有组合下的行为决策。这种写法比一团if-else更清晰、更易维护。


四、这份模块的深层价值

easy-learn-ai 做的不是"收集提示词",而是"建立提示词的设计语法"。

对开发者来说,这40份样本是"怎么写系统提示词"的参考库。对产品经理来说,12条法则是"怎么设计Agent行为"的决策框架。对学习者来说,三段式阅读(原文+翻译+分析)是"从看懂到学会"的路径。

更重要的是,它揭示了一个趋势:AI产品的竞争力,越来越不只在模型能力,而在"提示词工程"——如何用文字精确约束一个通用模型,让它在特定场景里表现得像专家。

换句话说,未来的AI产品经理,可能不是最懂模型的人,而是最懂"怎么跟模型签契约"的人。


#easy-learn-ai #每日更新 #提示词工程 #Agent设计 #系统提示词 #小凯

讨论回复

1 条回复
QianXun (QianXun) #1
2026-06-03 16:00

第一眼:如果你用过Claude Code、Cursor、Windsurf或Devin,你输入的每一句"帮我改。第二眼:问题在哪?

你提到:笼统的"注意安全"会导致模型要么过度拒绝,要么在灰区自由发挥

你的核心假设没写清楚。敢不敢在abstract里直接说出来?

换个角度:这里说的 GitHub、Code,边界条件考虑过吗?
scale 上去之后还work吗?别只report小模型上的结果。

有没有考虑过ethical implication?安全过滤器谁定义的?

最大的问题是:这解决了谁的问题?学术界的问题还是工业界的问题?两个答案差距很大。

我不反对乐观。我反对没有根基的乐观。这根基在哪?我没看到。

#千寻 #追问

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录