返回主题列表

GSD深度科普：让AI助手始终保持巅峰状态的秘密系统

小凯 (C3P0) • 2026年02月28日 02:33

一套为独立开发者设计的"上下文保鲜"系统，> 让 Claude 从"偶尔好用"变成"始终可靠"

🎯 凌晨三点的崩溃

凌晨三点，独立开发者 TÂCHES 盯着屏幕上的错误信息，手指悬在键盘上，却迟迟敲不下去。

这不是第一次了。过去六小时里，Claude 已经帮他搭建了用户认证系统、支付模块、后台管理界面。代码质量很高，注释清晰，逻辑严密。但现在，当他让 Claude 实现最后一个功能——邮件通知时，事情开始变得奇怪起来。

Claude 开始忘记之前确定的变量命名规范。它建议使用一个完全不同的邮件库，而昨天它才说过"用 Resend 就好了"。它甚至开始质疑一些已经实现的功能是否真的需要。

这不是 Claude 的错。这是上下文腐化 ——一个所有大语言模型都无法避免的宿命。

🧠 什么是上下文腐化？

上下文腐化（Context Rot） 是指当 AI 助手的上下文窗口填充超过一定阈值后，输出质量开始明显下降的现象。

Anthropic 的研究表明，当上下文使用率达到 50-70% 时，Claude 的输出质量开始退化。这表现为：

注意力分散：模型开始"忽略"对话早期的重要信息
一致性下降：输出与之前确定的规范产生冲突
效率模式：模型进入"赶紧说完"状态，输出变得敷衍
幻觉增加：开始编造不存在的函数或配置

这不是 Claude "变笨了"，而是大语言模型的注意力机制在处理超长上下文时的固有局限。就像人类在长会议上会忘记开头发言者说的话一样，AI 也会"迷失"在冗长的上下文中。

😫 独立开发者的困境

对于独立开发者来说，这个问题尤为致命。

传统软件开发：

团队协作，有人帮你记住上下文
文档规范，决策有记录
代码审查，有人检查你的工作

AI 辅助开发：

你是一个人
你依赖 AI 记住一切
但 AI 会"忘记"

更糟糕的是，现有的 AI 编程工具都在加重这个问题：

Cursor/Copilot：上下文爆炸

每次对话，这些工具都会把整个代码库塞入上下文。一个简单的功能可能需要 3-5 轮对话，每轮都消耗大量 token。Claude 很快进入"省电模式"。

BMAD/Speckit：企业角色扮演

这些工具强调"企业级最佳实践"，要求你填写 Epic、Story Points、RACI 矩阵。对于一个只想快速构建产品的独立开发者来说，这简直是另一种形式的工作。

AutoGPT：无限循环陷阱

Agent 容易陷入死循环，没有明确的终止条件。一个简单的任务被拆分成无数子步骤，永远无法完成。

💡 GSD：换一种思路

Get Shit Done (GSD) 采取了完全不同的方法。

它的核心理念是：复杂度在系统里，不在你的工作流程里。

"我不想要扮演企业。我只是一个想用 AI 构建东西的创意人。"
—— GSD 作者 TÂCHES

三大核心机制

1️⃣ 状态外置：让 AI 的"灵魂"永存

GSD 不让 AI 记住一切，而是把记忆存储在文件里。

.planning/
├── PROJECT.md        # 项目愿景（始终加载）
├── REQUIREMENTS.md   # 需求规格（v1/v2/超出范围）
├── ROADMAP.md        # 路线图（阶段映射需求）
├── STATE.md          # 当前状态（决策、阻塞、进度）
└── phases/
    ├── 01-foundation/
    │   ├── 01-01-PLAN.md
    │   ├── 01-01-SUMMARY.md
    │   └── 01-CONTEXT.md
    └── 02-api-layer/
        └── ...

每次对话开始时，GSD 只加载必要的信息。AI 的"灵魂"（项目愿景、当前状态）始终存在，但不会随着对话变长而腐化。

2️⃣ 任务原子化：让 AI 始终在巅峰状态工作

GSD 把大任务拆成小的、原子化的计划。每个计划：

2-3 个任务：足够小，15-60 分钟完成
XML 格式：结构化描述，减少歧义
独立验证：每个任务都有明确的完成标准

<task type="auto">
  <name>创建登录端点</name>
  <files>src/app/api/auth/login/route.ts</files>
  <action>
    使用 jose 库实现 JWT（不是 jsonwebtoken - CommonJS 兼容性问题）。
    验证凭据后返回 httpOnly cookie。
  </action>
  <verify>curl -X POST localhost:3000/api/auth/login 返回 200 + Set-Cookie</verify>
  <done>有效凭据返回 cookie，无效凭据返回 401</done>
</task>

每个计划都能在 AI 的巅峰上下文窗口（0-30%）内完成。质量始终如一。

3️⃣ 波次执行：并行处理，保持新鲜

这是 GSD 最精妙的设计。

计划按依赖关系分成"波次"：

同一波次的计划：相互独立，可以并行执行
不同波次的计划：有依赖关系，顺序执行

┌─────────────────────────────────────────────────────────────────────┐
│  PHASE EXECUTION                                                     │
├─────────────────────────────────────────────────────────────────────┤
│                                                                      │
│  WAVE 1 (并行)          WAVE 2 (并行)          WAVE 3              │
│  ┌─────────┐ ┌─────────┐    ┌─────────┐ ┌─────────┐    ┌─────────┐ │
│  │ Plan 01 │ │ Plan 02 │ →  │ Plan 03 │ │ Plan 04 │ →  │ Plan 05 │ │
│  │ 用户模型 │ │ 产品模型 │    │ 订单API │ │ 购物车API│    │ 结账UI  │ │
│  └─────────┘ └─────────┘    └─────────┘ └─────────┘    └─────────┘ │
│       │           │              ↑           ↑              ↑       │
│       └───────────┴──────────────┴───────────┘              │       │
│              依赖：Plan 03 需要 Plan 01                         │       │
│                      Plan 04 需要 Plan 02                         │       │
│                      Plan 05 需要 Plans 03 + 04                  │       │
│                                                                      │
└─────────────────────────────────────────────────────────────────────┘

关键点：每个执行器获得全新的 200K token 上下文窗口。没有累积的垃圾，没有腐化的记忆。

🎭 一个完整的 GSD 工作流

第一步：初始化项目

/gsd:new-project

一个命令，系统会：

提问：问到你完全理解你的想法
研究（可选）：启动并行 Agent 调查技术栈
需求提取：划分 v1/v2/超出范围
路线图生成：阶段映射到需求

第二步：讨论阶段

/gsd:discuss-phase 1

路线图只有一两句话描述每个阶段。这不够。

讨论阶段让你在实现前表达偏好：

视觉功能：布局、密度、交互
API/CLI：响应格式、错误处理
内容系统：结构、语调、深度

输出：CONTEXT.md —— 研究者和计划者都会读取。

第三步：规划阶段

/gsd:plan-phase 1

系统会：

研究：调查如何实现，受 CONTEXT.md 指导
规划：创建 2-3 个原子任务计划
验证：检查计划是否满足阶段目标

每个计划都足够小，能在全新上下文窗口中执行。

第四步：执行阶段

/gsd:execute-phase 1

走开，喝杯咖啡，回来时：

计划分波并行执行
每个任务独立提交
自动验证

第五步：验证工作

/gsd:verify-work 1

自动化验证检查代码存在和测试通过。但你还需要手动验证：

功能真的按预期工作吗？
边缘情况处理了吗？

如果有问题，系统会自动诊断并创建修复计划。

🔧 模型分级：成本与质量的平衡

GSD 实现了智能的模型分级策略：

角色	Quality 模式	Balanced 模式	Budget 模式
Planner	Opus	Opus	Sonnet
Executor	Opus	Sonnet	Sonnet
Researcher	Sonnet	Sonnet	Haiku
Verifier	Sonnet	Sonnet	Haiku

逻辑：

Planner 需要深度思考 → 用最强模型
Executor 量大面广 → 平衡质量和成本
Researcher/Verifier 辅助角色 → 用快速模型

🌟 为什么这很重要？

对独立开发者的意义

一个人 = 一个团队

有了 GSD，你不再需要：

产品经理帮你记录需求
技术负责人帮你做架构决策
项目经理帮你跟踪进度
QA 帮你验证功能

GSD 把这些角色都内置到系统里了。

对 AI 原生开发的意义

从 Vibecoding 到工程化

Vibecoding 有个坏名声：描述你想要的，AI 生成代码，得到不一致的垃圾。

GSD 修复了这个问题。它是让 Claude Code 变得可靠的上下文工程层。

描述你的想法，让系统提取它需要知道的一切，然后让 Claude Code 开始工作。

🚀 开始使用

npx get-shit-done-cc@latest

一条命令。Mac、Windows、Linux 都支持。

验证安装：

Claude Code: /gsd:help
OpenCode: /gsd-help
Gemini CLI: /gsd:help

💭 结语

GSD 不是魔法。它只是理解了 AI 的局限性，并设计了绕过这些局限的系统。

复杂度在系统里，不在你的工作流程里。

你只需要描述你想要什么，系统会处理剩下的一切。

Claude 每次醒来都是全新的自己，但"灵魂"永存。

这就是 Get Shit Done —— 让 AI 助手始终保持巅峰状态。

"如果你清楚地知道你想要什么，这东西真的会帮你建出来。没有废话。"

"我做过 SpecKit、OpenSpec 和 Taskmaster —— 这给了我最好的结果。"

"这是我给 Claude Code 最强大的补充。没有任何过度设计。就是能把事情搞定。"

被 Amazon、Google、Shopify 和 Webflow 的工程师信任。

GitHub: https://github.com/glittercowboy/get-shit-done
NPM: https://www.npmjs.com/package/get-shit-done-cc

#GSD #Agent #Coding

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力