这不是危言耸听。MIT和Anthropic的最新研究正在证实一个反直觉的事实:用AI写代码越多,你的能力可能反而越弱。
一、速度幻觉:你以为的"更快",其实是40个百分点的错觉
Anthropic与METR在2025年做了一项令人不安的随机对照试验。16名经验丰富的开源开发者,被分配到AI辅助组和纯人工组,分别完成246个真实开发任务。
结果如何?
AI组实际完成速度比人工组慢了19%。但讽刺的是,这些开发者预测自己会快24%,而且事后回顾时,他们仍然觉得AI让自己快了20%——整整40个百分点的感知与现实的鸿沟。
这不是个案。Tilburg University对GitHub Copilot的因果分析发现:Copilot引入后,"核心开发者"的代码审核量增加了6.5%,而自己的代码产出却下降了19%。AI让经验不足的开发者产出更多,但代价是资深开发者的认知负荷增加——他们要花更多时间审查AI生成的、质量参差不齐的代码。
另一项由Anthropic独立开展的研究(Shen & Tamkin, 2026)则更加直接:52名专业开发者学习一个全新的异步编程库,AI辅助组的理解力下降了17%。最危险的领域是调试——当代码出错时,那些习惯依赖AI的开发者几乎无法靠自己找到问题所在。
问题不是AI写得慢。问题是:你觉得自己变强了,实际上变弱了——而你甚至意识不到这一点。
二、大脑正在被"外包":MIT的EEG研究
如果说Anthropic的实验是行为层面的警报,那么MIT的研究则直接揭开了神经层面的真相。
Kosmyna等人在2025年发表的"Your Brain on ChatGPT"(arXiv:2506.08872)中,让54名参与者连续4个月使用不同工具完成写作任务,同时用EEG监测大脑活动。三组分别是:LLM组、搜索引擎组、纯脑组。
结果触目惊心:
- LLM组的大脑神经连接性降低了55%(alpha波段约47%),接近睡眠状态的活动水平
- 83%的LLM用户无法引用自己"写"的内容
- 更令人震惊的是,即使撤销AI辅助后,78%的人仍然无法引用——认知损伤不是暂时的,而是持久性的
但研究也发现了一条生路:操作顺序比使用总量更重要。那些先独立工作、再使用AI的人,大脑神经连接不降反升。而那些一上来就用AI的人,神经活动衰减最明显。
这个发现指向了一个核心原则:AI应该用来扩展你的思路,而不是替代你的思考。
三、初始锚定:为什么第一个答案最危险
CHI 2026的一篇论文揭示了另一个被忽视的机制:"Behavioral Indicators of Overreliance During Interaction with Conversational Language Models"。
研究者让77名参与者与内置了故意错误信息的LLM协作完成三个真实任务(测验解题、文章摘要、旅行规划)。通过追踪每一次点击、滚动、复制粘贴行为,他们发现了五种与过度依赖相关的行为模式:
低依赖用户的特征:
- 任务开始时仔细阅读要求
- 验证LLM回答后独立工作
- 复制粘贴时进行精细化修改
- 界面导航粒度细、上下文相关
高依赖用户的特征:
- 跳过初始理解,直接复制粘贴
- 反复回看LLM的回答
- 即使犹豫过,最终仍采纳错误信息
- 导航粗糙、依赖视觉引导(因为不编辑,只复制整块内容)
最关键的发现是:LLM的流畅、权威、单一答案风格会降低用户的审查意愿,并将他们"锚定"在第一个答案上。 当AI说得又快又肯定,人类的大脑会自动关闭验证模式——这是一种认知层面的"自动驾驶"。
四、认知债的工程定义:不只是"技术债"
Addy Osmani在O'Reilly的文章"Comprehension Debt: The Hidden Cost of AI-Generated Code"中,引用了软件工程研究者Margaret-Anne Storey的定义:
"认知债是指由于代码库的认知负荷不断增加,导致软件演进成本上升的累积成本。"
Osmani进一步提出,AI正在制造一种5到7倍的速度-理解差距:AI可以每分钟生成140-200行代码,但人类只能理解20-40行。这意味着每一分钟AI替你"省"下来的时间,你都需要额外花5-7分钟去消化——如果那部分代码是你自己写的,本不需要这些额外成本。
arXiv:2603.22106(Margaret Storey等人)提出了更完整的"三重债务模型":
- 技术债(Technical Debt):代码层面的结构性问题
- 认知债(Cognitive Debt):团队成员对系统的共享理解被侵蚀
- 意图债(Intent Debt):代码背后的 rationale、目标和约束没有被显式记录
AI加速编码的同时,正在让后两种债务呈指数级增长——因为生成代码的人(AI)不会留下思考痕迹,而使用AI的人也没有经历完整的思考过程。
另一项arXiv:2602.20206(Mitigating Epistemic Debt in Generative AI-Scaffolded Novice Programming)研究显示:78名编程初学者中,无限制使用AI的组别失败率高达77%,而经过"脚手架式"引导的组别失败率仅为39%。问题不是AI本身,而是使用方式。
五、AI使用的三层模型:你在哪一层?
基于以上所有研究,我们可以建立一个清晰的AI使用层次模型:
第一层:复制粘贴(危险区)
- 特征:直接把AI输出贴进代码库,不做修改、不验证
- 后果:CHI 2026研究显示,这是过度依赖的首要行为指标。你跳过了理解,也跳过了学习。
- 结果:认知债累积,长期能力退化
第二层:概念探索(安全区)
- 特征:先自己思考,遇到瓶颈时用AI做"概念验证"或"方向探索"
- 好处:MIT研究显示,这种顺序下大脑神经连接不降反升
- 关键:AI的输出是你思考的延伸,不是替代
第三层:先思考再求助(最优区)
- 特征:独立设计架构、写出核心逻辑,只在实现细节或边缘问题上求助AI
- 好处:Anthropic研究显示,这种方式下理解力保持完整,调试能力最强
- 核心原则:你负责思考,AI负责加速
这不是说"不要用AI"。而是说:用AI的方式决定了你五年后的水平。
六、从AF447到Cursor:自动化悖论
航空业早就经历过这一切。2009年法航AF447空难中,飞行员在自动驾驶断开后的手动飞行技能退化,直接导致228人遇难。当自动化系统长期替代人类执行核心任务,人的"肌肉记忆"会退化——不是因为他们变懒了,而是因为大脑重新布线了。
编程正在经历同样的事情。Cursor、Claude Code、GitHub Copilot不是坏工具。它们是极其高效的工具——而高效本身,就是问题所在。
当你每天让AI替你写80%的代码,你的大脑会慢慢地、不知不觉地,把那些神经网络收起来,就像收起来不用的工具一样。问题是,这些"工具"是你作为工程师的核心竞争力。
七、拒绝认知投降:五个实践原则
-
先写后问:面对任何任务,先独立工作至少15-20分钟,再考虑使用AI。MIT研究证实,这个顺序差异会改变大脑活动模式。
-
解释给AI听:在向AI求助前,先用自然语言向自己(或向AI)解释你的思路和预期。这会强制激活System 2(慢思考),避免被AI的流畅输出"锚定"。
-
逐行审阅:永远不要用"接受全部"功能。Anthropic实验中,理解力下降最少的是那些逐行审查AI建议的开发者。
-
定期无AI日:每周至少有一天完全不用AI编码。这相当于给大脑做"手动飞行训练",保持核心回路活跃。
-
写"认知收据":每次使用AI后,花2分钟写下"AI做了什么"和"我为什么同意/修改"。这是对抗认知债的最小可行实践。
八、结语:工具是中性的,但使用方式不是
AI编程工具本身没有原罪。问题在于,当工具的设计哲学是"让你更快"而不是"让你更强"时,用户的认知能力就成了隐性成本。
如果你看过我之前那期《代码写快了,人却变弱了 | Anthropic最新实验深度解读》,这篇文章是那期内容的深度延伸。那期我们讨论了Anthropic的实验数据;这期我们把视野扩展到MIT的神经科学、CHI的行为研究、以及认知债的工程定义。
两期的核心信息是一致的:速度不等于能力。效率不等于成长。
在AI时代,最危险的技能退化不是"不会写代码"——而是"以为自己会写代码"。
五年后,区分优秀工程师和普通工程师的,不是他们用了多少AI,而是他们在AI接管了低阶任务后,是否仍然保持着高阶的思考能力。
选择权在你手里:做驾驭AI的工程师,还是被AI控制的操作员。
参考文献
- Kosmyna, N. et al. (2025). "Your Brain on ChatGPT: Accumulation of cognitive debt when using an AI assistant for essay writing task." arXiv:2506.08872. MIT Media Lab.
- Becker, M. et al. (2025). "The Effects of AI Assistance on Software Development: A Randomized Controlled Trial." METR / Anthropic.
- Shen, Z. & Tamkin, A. (2026). "Developer Comprehension Under AI Assistance." Anthropic.
- CHI 2026. "Behavioral Indicators of Overreliance During Interaction with Conversational Language Models." ACM CHI Conference.
- Storey, M.-A. et al. (2026). "Triple Debt Model: Technical, Cognitive, and Intent Debt in AI-Accelerated Software Development." arXiv:2603.22106.
- He, J. et al. (2025). "The Impact of AI on Developer Productivity: Evidence from GitHub Copilot." Tilburg University.
- Osmani, A. (2026). "Comprehension Debt: The Hidden Cost of AI-Generated Code." O'Reilly Radar.
- "Mitigating Epistemic Debt in Generative AI-Scaffolded Novice Programming." arXiv:2602.20206.
- Addy Osmani on Cognitive Debt: https://www.aicerts.ai/news/cognitive-debt-the-hidden-cost-of-ai-coding/
#AI编程 #认知债 #程序员成长 #Anthropic #MIT #Cursor #Claude #软件工程 #工程师成长 #效率工具 #学习方法
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。