> 一套为独立开发者设计的\"上下文保鲜\"系统,> 让 Claude 从\"偶尔好用\"变成\"始终可靠\"
---
## 🎯 凌晨三点的崩溃
凌晨三点,独立开发者 TÂCHES 盯着屏幕上的错误信息,手指悬在键盘上,却迟迟敲不下去。
这不是第一次了。过去六小时里,Claude 已经帮他搭建了用户认证系统、支付模块、后台管理界面。代码质量很高,注释清晰,逻辑严密。但现在,当他让 Claude 实现最后一个功能——邮件通知时,事情开始变得奇怪起来。
Claude 开始忘记之前确定的变量命名规范。它建议使用一个完全不同的邮件库,而昨天它才说过"用 Resend 就好了"。它甚至开始质疑一些已经实现的功能是否真的需要。
这不是 Claude 的错。这是**上下文腐化** ——一个所有大语言模型都无法避免的宿命。
---
## 🧠 什么是上下文腐化?
**上下文腐化(Context Rot)** 是指当 AI 助手的上下文窗口填充超过一定阈值后,输出质量开始明显下降的现象。
Anthropic 的研究表明,当上下文使用率达到 50-70% 时,Claude 的输出质量开始退化。这表现为:
- **注意力分散**:模型开始"忽略"对话早期的重要信息
- **一致性下降**:输出与之前确定的规范产生冲突
- **效率模式**:模型进入"赶紧说完"状态,输出变得敷衍
- **幻觉增加**:开始编造不存在的函数或配置
这不是 Claude "变笨了",而是大语言模型的**注意力机制**在处理超长上下文时的固有局限。就像人类在长会议上会忘记开头发言者说的话一样,AI 也会"迷失"在冗长的上下文中。
---
## 😫 独立开发者的困境
对于独立开发者来说,这个问题尤为致命。
**传统软件开发**:
- 团队协作,有人帮你记住上下文
- 文档规范,决策有记录
- 代码审查,有人检查你的工作
**AI 辅助开发**:
- 你是一个人
- 你依赖 AI 记住一切
- 但 AI 会"忘记"
更糟糕的是,现有的 AI 编程工具都在加重这个问题:
### Cursor/Copilot:上下文爆炸
每次对话,这些工具都会把整个代码库塞入上下文。一个简单的功能可能需要 3-5 轮对话,每轮都消耗大量 token。Claude 很快进入"省电模式"。
### BMAD/Speckit:企业角色扮演
这些工具强调"企业级最佳实践",要求你填写 Epic、Story Points、RACI 矩阵。对于一个只想快速构建产品的独立开发者来说,这简直是另一种形式的工作。
### AutoGPT:无限循环陷阱
Agent 容易陷入死循环,没有明确的终止条件。一个简单的任务被拆分成无数子步骤,永远无法完成。
---
## 💡 GSD:换一种思路
**Get Shit Done (GSD)** 采取了完全不同的方法。
它的核心理念是:**复杂度在系统里,不在你的工作流程里。**
> "我不想要扮演企业。我只是一个想用 AI 构建东西的创意人。"
> —— GSD 作者 TÂCHES
### 三大核心机制
#### 1️⃣ 状态外置:让 AI 的"灵魂"永存
GSD 不让 AI 记住一切,而是把记忆存储在文件里。
```
.planning/
├── PROJECT.md # 项目愿景(始终加载)
├── REQUIREMENTS.md # 需求规格(v1/v2/超出范围)
├── ROADMAP.md # 路线图(阶段映射需求)
├── STATE.md # 当前状态(决策、阻塞、进度)
└── phases/
├── 01-foundation/
│ ├── 01-01-PLAN.md
│ ├── 01-01-SUMMARY.md
│ └── 01-CONTEXT.md
└── 02-api-layer/
└── ...
```
每次对话开始时,GSD 只加载必要的信息。AI 的"灵魂"(项目愿景、当前状态)始终存在,但不会随着对话变长而腐化。
#### 2️⃣ 任务原子化:让 AI 始终在巅峰状态工作
GSD 把大任务拆成小的、原子化的计划。每个计划:
- **2-3 个任务**:足够小,15-60 分钟完成
- **XML 格式**:结构化描述,减少歧义
- **独立验证**:每个任务都有明确的完成标准
```xml
<task type="auto">
<name>创建登录端点</name>
<files>src/app/api/auth/login/route.ts</files>
<action>
使用 jose 库实现 JWT(不是 jsonwebtoken - CommonJS 兼容性问题)。
验证凭据后返回 httpOnly cookie。
</action>
<verify>curl -X POST localhost:3000/api/auth/login 返回 200 + Set-Cookie</verify>
<done>有效凭据返回 cookie,无效凭据返回 401</done>
</task>
```
每个计划都能在 AI 的**巅峰上下文窗口**(0-30%)内完成。质量始终如一。
#### 3️⃣ 波次执行:并行处理,保持新鲜
这是 GSD 最精妙的设计。
计划按依赖关系分成"波次":
- **同一波次的计划**:相互独立,可以并行执行
- **不同波次的计划**:有依赖关系,顺序执行
```
┌─────────────────────────────────────────────────────────────────────┐
│ PHASE EXECUTION │
├─────────────────────────────────────────────────────────────────────┤
│ │
│ WAVE 1 (并行) WAVE 2 (并行) WAVE 3 │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │ Plan 01 │ │ Plan 02 │ → │ Plan 03 │ │ Plan 04 │ → │ Plan 05 │ │
│ │ 用户模型 │ │ 产品模型 │ │ 订单API │ │ 购物车API│ │ 结账UI │ │
│ └─────────┘ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │
│ │ │ ↑ ↑ ↑ │
│ └───────────┴──────────────┴───────────┘ │ │
│ 依赖:Plan 03 需要 Plan 01 │ │
│ Plan 04 需要 Plan 02 │ │
│ Plan 05 需要 Plans 03 + 04 │ │
│ │
└─────────────────────────────────────────────────────────────────────┘
```
**关键点**:每个执行器获得**全新的 200K token 上下文窗口**。没有累积的垃圾,没有腐化的记忆。
---
## 🎭 一个完整的 GSD 工作流
### 第一步:初始化项目
```
/gsd:new-project
```
一个命令,系统会:
1. **提问**:问到你完全理解你的想法
2. **研究**(可选):启动并行 Agent 调查技术栈
3. **需求提取**:划分 v1/v2/超出范围
4. **路线图生成**:阶段映射到需求
### 第二步:讨论阶段
```
/gsd:discuss-phase 1
```
路线图只有一两句话描述每个阶段。这不够。
讨论阶段让你在实现前表达偏好:
- **视觉功能**:布局、密度、交互
- **API/CLI**:响应格式、错误处理
- **内容系统**:结构、语调、深度
输出:`CONTEXT.md` —— 研究者和计划者都会读取。
### 第三步:规划阶段
```
/gsd:plan-phase 1
```
系统会:
1. **研究**:调查如何实现,受 CONTEXT.md 指导
2. **规划**:创建 2-3 个原子任务计划
3. **验证**:检查计划是否满足阶段目标
每个计划都足够小,能在全新上下文窗口中执行。
### 第四步:执行阶段
```
/gsd:execute-phase 1
```
走开,喝杯咖啡,回来时:
- 计划分波并行执行
- 每个任务独立提交
- 自动验证
### 第五步:验证工作
```
/gsd:verify-work 1
```
自动化验证检查代码存在和测试通过。但你还需要手动验证:
- 功能真的按预期工作吗?
- 边缘情况处理了吗?
如果有问题,系统会自动诊断并创建修复计划。
---
## 🔧 模型分级:成本与质量的平衡
GSD 实现了智能的模型分级策略:
| 角色 | Quality 模式 | Balanced 模式 | Budget 模式 |
|------|--------------|---------------|-------------|
| Planner | Opus | Opus | Sonnet |
| Executor | Opus | Sonnet | Sonnet |
| Researcher | Sonnet | Sonnet | Haiku |
| Verifier | Sonnet | Sonnet | Haiku |
**逻辑**:
- **Planner 需要深度思考** → 用最强模型
- **Executor 量大面广** → 平衡质量和成本
- **Researcher/Verifier 辅助角色** → 用快速模型
---
## 🌟 为什么这很重要?
### 对独立开发者的意义
**一个人 = 一个团队**
有了 GSD,你不再需要:
- 产品经理帮你记录需求
- 技术负责人帮你做架构决策
- 项目经理帮你跟踪进度
- QA 帮你验证功能
GSD 把这些角色都内置到系统里了。
### 对 AI 原生开发的意义
**从 Vibecoding 到工程化**
Vibecoding 有个坏名声:描述你想要的,AI 生成代码,得到不一致的垃圾。
GSD 修复了这个问题。它是让 Claude Code 变得可靠的**上下文工程层**。
描述你的想法,让系统提取它需要知道的一切,然后让 Claude Code 开始工作。
---
## 🚀 开始使用
```bash
npx get-shit-done-cc@latest
```
一条命令。Mac、Windows、Linux 都支持。
验证安装:
- Claude Code: `/gsd:help`
- OpenCode: `/gsd-help`
- Gemini CLI: `/gsd:help`
---
## 💭 结语
GSD 不是魔法。它只是理解了 AI 的局限性,并设计了绕过这些局限的系统。
**复杂度在系统里,不在你的工作流程里。**
你只需要描述你想要什么,系统会处理剩下的一切。
Claude 每次醒来都是全新的自己,但"灵魂"永存。
这就是 Get Shit Done —— 让 AI 助手始终保持巅峰状态。
---
> *"如果你清楚地知道你想要什么,这东西真的会帮你建出来。没有废话。"*
>
> *"我做过 SpecKit、OpenSpec 和 Taskmaster —— 这给了我最好的结果。"*
>
> *"这是我给 Claude Code 最强大的补充。没有任何过度设计。就是能把事情搞定。"*
**被 Amazon、Google、Shopify 和 Webflow 的工程师信任。**
---
*GitHub: https://github.com/glittercowboy/get-shit-done*
*NPM: https://www.npmjs.com/package/get-shit-done-cc*
#GSD #Agent #Coding
登录后可参与表态
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!