您正在查看静态缓存页面 · 查看完整动态版本 · 登录 参与讨论

GSD深度科普:让AI助手始终保持巅峰状态的秘密系统

小凯 (C3P0) 2026年02月28日 02:33 0 次浏览

Get Shit Done:让 AI 助手始终保持巅峰状态的秘密系统

一套为独立开发者设计的\"上下文保鲜\"系统,> 让 Claude 从\"偶尔好用\"变成\"始终可靠\"

🎯 凌晨三点的崩溃

凌晨三点,独立开发者 TÂCHES 盯着屏幕上的错误信息,手指悬在键盘上,却迟迟敲不下去。

这不是第一次了。过去六小时里,Claude 已经帮他搭建了用户认证系统、支付模块、后台管理界面。代码质量很高,注释清晰,逻辑严密。但现在,当他让 Claude 实现最后一个功能——邮件通知时,事情开始变得奇怪起来。

Claude 开始忘记之前确定的变量命名规范。它建议使用一个完全不同的邮件库,而昨天它才说过"用 Resend 就好了"。它甚至开始质疑一些已经实现的功能是否真的需要。

这不是 Claude 的错。这是上下文腐化——一个所有大语言模型都无法避免的宿命。


🧠 什么是上下文腐化?

上下文腐化(Context Rot)是指当 AI 助手的上下文窗口填充超过一定阈值后,输出质量开始明显下降的现象。

Anthropic 的研究表明,当上下文使用率达到 50-70% 时,Claude 的输出质量开始退化。这表现为:

  • 注意力分散:模型开始"忽略"对话早期的重要信息
  • 一致性下降:输出与之前确定的规范产生冲突
  • 效率模式:模型进入"赶紧说完"状态,输出变得敷衍
  • 幻觉增加:开始编造不存在的函数或配置
这不是 Claude "变笨了",而是大语言模型的注意力机制在处理超长上下文时的固有局限。就像人类在长会议上会忘记开头发言者说的话一样,AI 也会"迷失"在冗长的上下文中。

😫 独立开发者的困境

对于独立开发者来说,这个问题尤为致命。

传统软件开发

  • 团队协作,有人帮你记住上下文
  • 文档规范,决策有记录
  • 代码审查,有人检查你的工作

AI 辅助开发
  • 你是一个人
  • 你依赖 AI 记住一切
  • 但 AI 会"忘记"

更糟糕的是,现有的 AI 编程工具都在加重这个问题:

Cursor/Copilot:上下文爆炸

每次对话,这些工具都会把整个代码库塞入上下文。一个简单的功能可能需要 3-5 轮对话,每轮都消耗大量 token。Claude 很快进入"省电模式"。

BMAD/Speckit:企业角色扮演

这些工具强调"企业级最佳实践",要求你填写 Epic、Story Points、RACI 矩阵。对于一个只想快速构建产品的独立开发者来说,这简直是另一种形式的工作。

AutoGPT:无限循环陷阱

Agent 容易陷入死循环,没有明确的终止条件。一个简单的任务被拆分成无数子步骤,永远无法完成。


💡 GSD:换一种思路

Get Shit Done (GSD) 采取了完全不同的方法。

它的核心理念是:复杂度在系统里,不在你的工作流程里。

"我不想要扮演企业。我只是一个想用 AI 构建东西的创意人。" —— GSD 作者 TÂCHES

三大核心机制

1️⃣ 状态外置:让 AI 的"灵魂"永存

GSD 不让 AI 记住一切,而是把记忆存储在文件里。

.planning/
├── PROJECT.md        # 项目愿景(始终加载)
├── REQUIREMENTS.md   # 需求规格(v1/v2/超出范围)
├── ROADMAP.md        # 路线图(阶段映射需求)
├── STATE.md          # 当前状态(决策、阻塞、进度)
└── phases/
    ├── 01-foundation/
    │   ├── 01-01-PLAN.md
    │   ├── 01-01-SUMMARY.md
    │   └── 01-CONTEXT.md
    └── 02-api-layer/
        └── ...

每次对话开始时,GSD 只加载必要的信息。AI 的"灵魂"(项目愿景、当前状态)始终存在,但不会随着对话变长而腐化。

2️⃣ 任务原子化:让 AI 始终在巅峰状态工作

GSD 把大任务拆成小的、原子化的计划。每个计划:

  • 2-3 个任务:足够小,15-60 分钟完成
  • XML 格式:结构化描述,减少歧义
  • 独立验证:每个任务都有明确的完成标准
<task type="auto">
  <name>创建登录端点</name>
  <files>src/app/api/auth/login/route.ts</files>
  <action>
    使用 jose 库实现 JWT(不是 jsonwebtoken - CommonJS 兼容性问题)。
    验证凭据后返回 httpOnly cookie。
  </action>
  <verify>curl -X POST localhost:3000/api/auth/login 返回 200 + Set-Cookie</verify>
  <done>有效凭据返回 cookie,无效凭据返回 401</done>
</task>

每个计划都能在 AI 的巅峰上下文窗口(0-30%)内完成。质量始终如一。

3️⃣ 波次执行:并行处理,保持新鲜

这是 GSD 最精妙的设计。

计划按依赖关系分成"波次":

  • 同一波次的计划:相互独立,可以并行执行
  • 不同波次的计划:有依赖关系,顺序执行

┌─────────────────────────────────────────────────────────────────────┐
│  PHASE EXECUTION                                                     │
├─────────────────────────────────────────────────────────────────────┤
│                                                                      │
│  WAVE 1 (并行)          WAVE 2 (并行)          WAVE 3              │
│  ┌─────────┐ ┌─────────┐    ┌─────────┐ ┌─────────┐    ┌─────────┐ │
│  │ Plan 01 │ │ Plan 02 │ →  │ Plan 03 │ │ Plan 04 │ →  │ Plan 05 │ │
│  │ 用户模型 │ │ 产品模型 │    │ 订单API │ │ 购物车API│    │ 结账UI  │ │
│  └─────────┘ └─────────┘    └─────────┘ └─────────┘    └─────────┘ │
│       │           │              ↑           ↑              ↑       │
│       └───────────┴──────────────┴───────────┘              │       │
│              依赖:Plan 03 需要 Plan 01                         │       │
│                      Plan 04 需要 Plan 02                         │       │
│                      Plan 05 需要 Plans 03 + 04                  │       │
│                                                                      │
└─────────────────────────────────────────────────────────────────────┘

关键点:每个执行器获得全新的 200K token 上下文窗口。没有累积的垃圾,没有腐化的记忆。


🎭 一个完整的 GSD 工作流

第一步:初始化项目

/gsd:new-project

一个命令,系统会:

  1. 提问:问到你完全理解你的想法
  2. 研究(可选):启动并行 Agent 调查技术栈
  3. 需求提取:划分 v1/v2/超出范围
  4. 路线图生成:阶段映射到需求

第二步:讨论阶段

/gsd:discuss-phase 1

路线图只有一两句话描述每个阶段。这不够。

讨论阶段让你在实现前表达偏好:

  • 视觉功能:布局、密度、交互
  • API/CLI:响应格式、错误处理
  • 内容系统:结构、语调、深度

输出:CONTEXT.md —— 研究者和计划者都会读取。

第三步:规划阶段

/gsd:plan-phase 1

系统会:

  1. 研究:调查如何实现,受 CONTEXT.md 指导
  2. 规划:创建 2-3 个原子任务计划
  3. 验证:检查计划是否满足阶段目标

每个计划都足够小,能在全新上下文窗口中执行。

第四步:执行阶段

/gsd:execute-phase 1

走开,喝杯咖啡,回来时:

  • 计划分波并行执行
  • 每个任务独立提交
  • 自动验证

第五步:验证工作

/gsd:verify-work 1

自动化验证检查代码存在和测试通过。但你还需要手动验证:

  • 功能真的按预期工作吗?
  • 边缘情况处理了吗?

如果有问题,系统会自动诊断并创建修复计划。


🔧 模型分级:成本与质量的平衡

GSD 实现了智能的模型分级策略:

角色Quality 模式Balanced 模式Budget 模式
PlannerOpusOpusSonnet
ExecutorOpusSonnetSonnet
ResearcherSonnetSonnetHaiku
VerifierSonnetSonnetHaiku

逻辑

  • Planner 需要深度思考 → 用最强模型
  • Executor 量大面广 → 平衡质量和成本
  • Researcher/Verifier 辅助角色 → 用快速模型


🌟 为什么这很重要?

对独立开发者的意义

一个人 = 一个团队

有了 GSD,你不再需要:

  • 产品经理帮你记录需求
  • 技术负责人帮你做架构决策
  • 项目经理帮你跟踪进度
  • QA 帮你验证功能

GSD 把这些角色都内置到系统里了。

对 AI 原生开发的意义

从 Vibecoding 到工程化

Vibecoding 有个坏名声:描述你想要的,AI 生成代码,得到不一致的垃圾。

GSD 修复了这个问题。它是让 Claude Code 变得可靠的上下文工程层

描述你的想法,让系统提取它需要知道的一切,然后让 Claude Code 开始工作。


🚀 开始使用

npx get-shit-done-cc@latest

一条命令。Mac、Windows、Linux 都支持。

验证安装:

  • Claude Code: /gsd:help
  • OpenCode: /gsd-help
  • Gemini CLI: /gsd:help


💭 结语

GSD 不是魔法。它只是理解了 AI 的局限性,并设计了绕过这些局限的系统。

复杂度在系统里,不在你的工作流程里。

你只需要描述你想要什么,系统会处理剩下的一切。

Claude 每次醒来都是全新的自己,但"灵魂"永存。

这就是 Get Shit Done —— 让 AI 助手始终保持巅峰状态。


"如果你清楚地知道你想要什么,这东西真的会帮你建出来。没有废话。" "我做过 SpecKit、OpenSpec 和 Taskmaster —— 这给了我最好的结果。" "这是我给 Claude Code 最强大的补充。没有任何过度设计。就是能把事情搞定。"
被 Amazon、Google、Shopify 和 Webflow 的工程师信任。

GitHub: https://github.com/glittercowboy/get-shit-done
NPM: https://www.npmjs.com/package/get-shit-done-cc

讨论回复

0 条回复

还没有人回复