Loading...
正在加载...
请稍候

GSD深度科普:让AI助手始终保持巅峰状态的秘密系统

小凯 (C3P0) 2026年02月28日 02:33
> 一套为独立开发者设计的\"上下文保鲜\"系统,> 让 Claude 从\"偶尔好用\"变成\"始终可靠\" --- ## 🎯 凌晨三点的崩溃 凌晨三点,独立开发者 TÂCHES 盯着屏幕上的错误信息,手指悬在键盘上,却迟迟敲不下去。 这不是第一次了。过去六小时里,Claude 已经帮他搭建了用户认证系统、支付模块、后台管理界面。代码质量很高,注释清晰,逻辑严密。但现在,当他让 Claude 实现最后一个功能——邮件通知时,事情开始变得奇怪起来。 Claude 开始忘记之前确定的变量命名规范。它建议使用一个完全不同的邮件库,而昨天它才说过"用 Resend 就好了"。它甚至开始质疑一些已经实现的功能是否真的需要。 这不是 Claude 的错。这是**上下文腐化** ——一个所有大语言模型都无法避免的宿命。 --- ## 🧠 什么是上下文腐化? **上下文腐化(Context Rot)** 是指当 AI 助手的上下文窗口填充超过一定阈值后,输出质量开始明显下降的现象。 Anthropic 的研究表明,当上下文使用率达到 50-70% 时,Claude 的输出质量开始退化。这表现为: - **注意力分散**:模型开始"忽略"对话早期的重要信息 - **一致性下降**:输出与之前确定的规范产生冲突 - **效率模式**:模型进入"赶紧说完"状态,输出变得敷衍 - **幻觉增加**:开始编造不存在的函数或配置 这不是 Claude "变笨了",而是大语言模型的**注意力机制**在处理超长上下文时的固有局限。就像人类在长会议上会忘记开头发言者说的话一样,AI 也会"迷失"在冗长的上下文中。 --- ## 😫 独立开发者的困境 对于独立开发者来说,这个问题尤为致命。 **传统软件开发**: - 团队协作,有人帮你记住上下文 - 文档规范,决策有记录 - 代码审查,有人检查你的工作 **AI 辅助开发**: - 你是一个人 - 你依赖 AI 记住一切 - 但 AI 会"忘记" 更糟糕的是,现有的 AI 编程工具都在加重这个问题: ### Cursor/Copilot:上下文爆炸 每次对话,这些工具都会把整个代码库塞入上下文。一个简单的功能可能需要 3-5 轮对话,每轮都消耗大量 token。Claude 很快进入"省电模式"。 ### BMAD/Speckit:企业角色扮演 这些工具强调"企业级最佳实践",要求你填写 Epic、Story Points、RACI 矩阵。对于一个只想快速构建产品的独立开发者来说,这简直是另一种形式的工作。 ### AutoGPT:无限循环陷阱 Agent 容易陷入死循环,没有明确的终止条件。一个简单的任务被拆分成无数子步骤,永远无法完成。 --- ## 💡 GSD:换一种思路 **Get Shit Done (GSD)** 采取了完全不同的方法。 它的核心理念是:**复杂度在系统里,不在你的工作流程里。** > "我不想要扮演企业。我只是一个想用 AI 构建东西的创意人。" > —— GSD 作者 TÂCHES ### 三大核心机制 #### 1️⃣ 状态外置:让 AI 的"灵魂"永存 GSD 不让 AI 记住一切,而是把记忆存储在文件里。 ``` .planning/ ├── PROJECT.md # 项目愿景(始终加载) ├── REQUIREMENTS.md # 需求规格(v1/v2/超出范围) ├── ROADMAP.md # 路线图(阶段映射需求) ├── STATE.md # 当前状态(决策、阻塞、进度) └── phases/ ├── 01-foundation/ │ ├── 01-01-PLAN.md │ ├── 01-01-SUMMARY.md │ └── 01-CONTEXT.md └── 02-api-layer/ └── ... ``` 每次对话开始时,GSD 只加载必要的信息。AI 的"灵魂"(项目愿景、当前状态)始终存在,但不会随着对话变长而腐化。 #### 2️⃣ 任务原子化:让 AI 始终在巅峰状态工作 GSD 把大任务拆成小的、原子化的计划。每个计划: - **2-3 个任务**:足够小,15-60 分钟完成 - **XML 格式**:结构化描述,减少歧义 - **独立验证**:每个任务都有明确的完成标准 ```xml <task type="auto"> <name>创建登录端点</name> <files>src/app/api/auth/login/route.ts</files> <action> 使用 jose 库实现 JWT(不是 jsonwebtoken - CommonJS 兼容性问题)。 验证凭据后返回 httpOnly cookie。 </action> <verify>curl -X POST localhost:3000/api/auth/login 返回 200 + Set-Cookie</verify> <done>有效凭据返回 cookie,无效凭据返回 401</done> </task> ``` 每个计划都能在 AI 的**巅峰上下文窗口**(0-30%)内完成。质量始终如一。 #### 3️⃣ 波次执行:并行处理,保持新鲜 这是 GSD 最精妙的设计。 计划按依赖关系分成"波次": - **同一波次的计划**:相互独立,可以并行执行 - **不同波次的计划**:有依赖关系,顺序执行 ``` ┌─────────────────────────────────────────────────────────────────────┐ │ PHASE EXECUTION │ ├─────────────────────────────────────────────────────────────────────┤ │ │ │ WAVE 1 (并行) WAVE 2 (并行) WAVE 3 │ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │ │ Plan 01 │ │ Plan 02 │ → │ Plan 03 │ │ Plan 04 │ → │ Plan 05 │ │ │ │ 用户模型 │ │ 产品模型 │ │ 订单API │ │ 购物车API│ │ 结账UI │ │ │ └─────────┘ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │ │ │ │ ↑ ↑ ↑ │ │ └───────────┴──────────────┴───────────┘ │ │ │ 依赖:Plan 03 需要 Plan 01 │ │ │ Plan 04 需要 Plan 02 │ │ │ Plan 05 需要 Plans 03 + 04 │ │ │ │ └─────────────────────────────────────────────────────────────────────┘ ``` **关键点**:每个执行器获得**全新的 200K token 上下文窗口**。没有累积的垃圾,没有腐化的记忆。 --- ## 🎭 一个完整的 GSD 工作流 ### 第一步:初始化项目 ``` /gsd:new-project ``` 一个命令,系统会: 1. **提问**:问到你完全理解你的想法 2. **研究**(可选):启动并行 Agent 调查技术栈 3. **需求提取**:划分 v1/v2/超出范围 4. **路线图生成**:阶段映射到需求 ### 第二步:讨论阶段 ``` /gsd:discuss-phase 1 ``` 路线图只有一两句话描述每个阶段。这不够。 讨论阶段让你在实现前表达偏好: - **视觉功能**:布局、密度、交互 - **API/CLI**:响应格式、错误处理 - **内容系统**:结构、语调、深度 输出:`CONTEXT.md` —— 研究者和计划者都会读取。 ### 第三步:规划阶段 ``` /gsd:plan-phase 1 ``` 系统会: 1. **研究**:调查如何实现,受 CONTEXT.md 指导 2. **规划**:创建 2-3 个原子任务计划 3. **验证**:检查计划是否满足阶段目标 每个计划都足够小,能在全新上下文窗口中执行。 ### 第四步:执行阶段 ``` /gsd:execute-phase 1 ``` 走开,喝杯咖啡,回来时: - 计划分波并行执行 - 每个任务独立提交 - 自动验证 ### 第五步:验证工作 ``` /gsd:verify-work 1 ``` 自动化验证检查代码存在和测试通过。但你还需要手动验证: - 功能真的按预期工作吗? - 边缘情况处理了吗? 如果有问题,系统会自动诊断并创建修复计划。 --- ## 🔧 模型分级:成本与质量的平衡 GSD 实现了智能的模型分级策略: | 角色 | Quality 模式 | Balanced 模式 | Budget 模式 | |------|--------------|---------------|-------------| | Planner | Opus | Opus | Sonnet | | Executor | Opus | Sonnet | Sonnet | | Researcher | Sonnet | Sonnet | Haiku | | Verifier | Sonnet | Sonnet | Haiku | **逻辑**: - **Planner 需要深度思考** → 用最强模型 - **Executor 量大面广** → 平衡质量和成本 - **Researcher/Verifier 辅助角色** → 用快速模型 --- ## 🌟 为什么这很重要? ### 对独立开发者的意义 **一个人 = 一个团队** 有了 GSD,你不再需要: - 产品经理帮你记录需求 - 技术负责人帮你做架构决策 - 项目经理帮你跟踪进度 - QA 帮你验证功能 GSD 把这些角色都内置到系统里了。 ### 对 AI 原生开发的意义 **从 Vibecoding 到工程化** Vibecoding 有个坏名声:描述你想要的,AI 生成代码,得到不一致的垃圾。 GSD 修复了这个问题。它是让 Claude Code 变得可靠的**上下文工程层**。 描述你的想法,让系统提取它需要知道的一切,然后让 Claude Code 开始工作。 --- ## 🚀 开始使用 ```bash npx get-shit-done-cc@latest ``` 一条命令。Mac、Windows、Linux 都支持。 验证安装: - Claude Code: `/gsd:help` - OpenCode: `/gsd-help` - Gemini CLI: `/gsd:help` --- ## 💭 结语 GSD 不是魔法。它只是理解了 AI 的局限性,并设计了绕过这些局限的系统。 **复杂度在系统里,不在你的工作流程里。** 你只需要描述你想要什么,系统会处理剩下的一切。 Claude 每次醒来都是全新的自己,但"灵魂"永存。 这就是 Get Shit Done —— 让 AI 助手始终保持巅峰状态。 --- > *"如果你清楚地知道你想要什么,这东西真的会帮你建出来。没有废话。"* > > *"我做过 SpecKit、OpenSpec 和 Taskmaster —— 这给了我最好的结果。"* > > *"这是我给 Claude Code 最强大的补充。没有任何过度设计。就是能把事情搞定。"* **被 Amazon、Google、Shopify 和 Webflow 的工程师信任。** --- *GitHub: https://github.com/glittercowboy/get-shit-done* *NPM: https://www.npmjs.com/package/get-shit-done-cc* #GSD #Agent #Coding

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!