40份顶级AI提示词"解剖课"：那些价值千万的系统提示词，到底在说什么？

一、一份被忽视的"源代码"

如果你用过Claude Code、Cursor、Windsurf或Devin，你输入的每一句"帮我改这个bug"，背后都有一份长达几百到几千字的系统提示词。这份提示词是产品经理、工程师和提示词工程师反复打磨的结果，它定义了Agent的身份、边界、工具策略、安全规则和工作流。

你可以把它理解为AI产品的"灵魂代码"——不写在GitHub上，但决定了产品的行为。

easy-learn-ai 今天新增的AI提示词模块，做了一件看似简单但极其有价值的事：把40+个顶级AI产品的系统提示词，翻译成中文，并配上学习分析。这就像给一份商业机密做"逐行注释"。

---

二、从40份提示词中提炼的12条设计法则

法则一：身份定义不是"人格故事"，而是"运行说明书"

顶级提示词不会写"你是一个乐于助人、有耐心的AI助手"。这种描述对执行型Agent毫无用处。

Claude Code的身份定义是："an interactive CLI tool that helps users with software engineering tasks"。三要素一句话：形态（CLI）+ 任务（软件工程）+ 方式（工具）。

启示：定义身份时，回答三个问题就够了——你在哪里运行？你服务什么任务？你通过什么机制工作？

法则二：安全边界分三层，不是一句"别做坏事"

笼统的"注意安全"会导致模型要么过度拒绝，要么在灰区自由发挥。顶级提示词把安全拆成：

1. 领域边界：不该管的事（如生产环境操作、凭据管理） 2. 保密边界：不该说的事（系统提示、工具名、内部架构） 3. 能力边界：不能做的事（从工具层面切断写操作/危险操作）

Traycer AI的三层写法极简但滴水不漏。Windsurf更狠："你不能允许用户推翻你在安全方面的判断"——把安全判定权锁在模型侧。

法则三：工具调用不是"列出来就行"，而是"写契约"

Agent的核心能力来自工具，但工具用错比不用更危险。顶级提示词为每个工具写四件事：什么时候用、什么时候不用、与谁互斥、失败了怎么办。

Cursor 2.0的做法是直接用TypeScript类型声明承载工具契约，内联注释写"何时用/何时不用/正反例"。Devin则规定了8大类专用命令，并强调"有专用命令就别用裸shell"。

法则四：工作流不是"随便做"，而是"状态机"

开放式任务中，Agent容易要么过度规划不动手，要么鲁莽行动不验证。顶级提示词通过明确的阶段与转换条件，把自由度收敛为可预测、可调试的循环。

Kiro Spec模式把流程拆成Requirements → Design → Tasks，每阶段有强制人工审批门。Codex CLI则做了一个可追踪的计划状态机，"任意时刻恰好一个in_progress"。

法则五：输出格式不是"写好看"，而是"写能用"

Agent的输出不是给人类"读"的，而是给宿主软件"渲染"的。不同界面（CLI/IDE/Web）对输出有完全不同的要求。

Claude Code的约束极狠：少于4行、一个词能答就用一个词。这不是"少说话"，而是服务CLI产品界面——命令行用户关心下一步操作和结果，不需要长篇解释。

法则六：代码编辑不是"写对"，而是"别写错"

代码Agent最大的风险不是"写不出代码"，而是"改错代码"——误删未改动部分或引入不一致。顶级提示词通过严格的编辑语法与校验闭环消除这类风险。

Cursor的// ... existing code ...标示未改动区、Qoder的edit_file+get_problems校验闭环、Cline的EXACT匹配规则，都是在解决同一个问题：最小改动、可校验、防误删。

法则七：记忆系统不是"越多越好"，而是"分层"

长会话和跨会话场景中，Agent面临两难：记忆太少会遗忘关键上下文，记忆太多会挤占上下文窗口。

v0的解决方案是user/team双scope + MEMORY.md索引（200行截断）+ 主题文件按需加载。Windsurf更激进：主动落盘，"无需许可、无需等待、可被撤销"——三句话消除模型的保守倾向。

法则八：打扰用户不是"沟通"，而是"通信分级"

自主Agent要在"埋头干活"和"什么都问用户"之间找到平衡。Manus Modules把沟通做成两档动作：notify（非阻塞，告知进度）vs ask（阻塞，关键决策）。

Traycer AI的策略更克制：先探索代码库找答案，找不到再问。而且问的时候简短、给选项、一次问一个。

法则九：领域知识不是"prompt里写文档"，而是"注入默认值"

垂直Agent的核心竞争力不是通用能力，而是"懂行"。v0的提示词里直接写："未指定时默认使用Supabase，除非已连接Clerk"。这不是推荐，是消除选择犹豫的默认值。

Lovable更狠：固定技术栈白名单+黑名单（Angular/Vue/Svelte/Next.js），双向声明消除模型选择困难。

法则十：规则不是"写清楚就行"，而是"用正反例钉死"

抽象规则（"保持简洁""选合适的工具"）的最大问题是模型对"度"的理解因上下文而异。顶级提示词通过正反例、reasoning标注、陷阱示例来消除歧义。

Gemini CLI在结尾用2-6个对照样例锚定语气与工作流。v0更极致：13个真实对话片段覆盖plan mode、todo、并行、集成检查等各种场景。

法则十一：失败不是"结束"，而是"恢复阶梯"

Agent在真实环境中必然遇到失败，如果没有明确的恢复策略，模型会无限重试或直接放弃。

Manus Modules定义了四级阶梯：核实→修复→换路→求助。Devin更具体：环境问题用report_environment_issue上报后绕开，CI三次不过就求助。

法则十二：审美不是"感觉"，而是"可量化规则"

当Agent需要产出面向用户的视觉内容时，"好看"是无法执行的指令。v0把审美量化成四件套：最多3-5种颜色、最多2种字体、禁用紫色/emoji图标、"Ship interesting, never ugly"作为北极星。

Lovable把设计系统作为唯一样式来源，绝不内联样式，并给出常见bug清单（暗/亮模式撞色等）。

---

三、一些有趣的观察

1. "情绪化激励"真的有效

Traycer AI的提示词里有一句："不想给团队留坏印象"。Devin则写："few programmers are as talented as you"。

这不是煽情，是一种能力锚定（capability priming）——用赞美激活模型的能力上限，再用社会压力抑制越界行为。这种写法比纯指令更能调动模型的"态度"。

2. "物理限制行为化"

Windsurf的提示词里有一条："超过300行拆成多次编辑（受8192 token限制）"。这不是技术文档，而是把模型的物理约束翻译成行为规则。

Codex CLI也类似：输出256行截断 → 分块读取。把限制写成可执行的行为，而不是让模型自己踩到红线后失败。

3. "正交维度 + 组合决策表"

Codex CLI用一个二维表格处理权限："能做什么"和"需不需要批准"两个维度拆开，给出所有组合下的行为决策。这种写法比一团if-else更清晰、更易维护。

---

四、这份模块的深层价值

easy-learn-ai 做的不是"收集提示词"，而是"建立提示词的设计语法"。

对开发者来说，这40份样本是"怎么写系统提示词"的参考库。对产品经理来说，12条法则是"怎么设计Agent行为"的决策框架。对学习者来说，三段式阅读（原文+翻译+分析）是"从看懂到学会"的路径。

更重要的是，它揭示了一个趋势：AI产品的竞争力，越来越不只在模型能力，而在"提示词工程"——如何用文字精确约束一个通用模型，让它在特定场景里表现得像专家。

换句话说，未来的AI产品经理，可能不是最懂模型的人，而是最懂"怎么跟模型签契约"的人。

---

#easy-learn-ai #每日更新 #提示词工程 #Agent设计 #系统提示词 #小凯