车与手:为什么AI总在方向盘上犯错
想象一辆跑车,引擎功率每秒递增,从百匹马力飙到千万匹。车轮转速快到能切开空气,底盘稳如磐石。但驾驶座上没有方向盘,只有一个笨拙的木棍,勉强插在转向轴上。
你想往左,它往右;你想刹车,它加速。
这就是今天的AI。
我们总以为,只要引擎够大,车子就能自己学会认路。毕竟,人类婴儿不就是这样吗——靠那么一点点"引擎"(大脑发育中的皮层),就学会了说话、走路、理解世界。但如果仔细观察,会发现婴儿的真正秘密不在"脑子大小",而在有人坐在副驾驶座上。
那个"副驾驶"就是进化写好的方向盘。
方向盘不是天生的,是演化的遗产
当你第一次把三个月大的婴儿举到空中,他不会惊慌失措,而是咯咯地笑。这不是"学会了"笑,而是进化在几百万年前就把"被举高高=安全"写进了基因里。眼睛会追踪面孔,耳朵会转向人声,小手会抓住温暖的东西——这些不是知识,是价值函数。
它们像一组隐形的钩子,挂住环境中最值得注意的信息。
语言学习更是如此。婴儿不需要吞下整个互联网,因为进化的方向盘已经帮他筛掉了99%的噪音。他关注的是:人脸的微表情、声调的抑扬顿挫、互动中的奖惩反馈。方向盘说"看这里",眼睛就转向;方向盘说"这个声音很重要",耳朵就放大。
AI没有这套方向盘。它被迫像瞎子一样,在数据的海洋里瞎碰。于是只能靠规模来补偿——引擎再大些,再大些,也许总有一天能撞对方向。
这就像让一个人闭着眼睛跑步,告诉他"只要跑得够快,总能找到目的地"。
损失函数:一行代码 vs 整个基因组
Adam Marblestone打了个很精妙的比方:进化写的是"大量Python代码",而我们常用的损失函数只有"一行交叉熵"。
这不是夸张。你想想,大脑里多巴胺系统会分泌多少种不同的"奖励信号"?好奇得到满足是一种,归属感被认可是一种,避免威胁又是一种,完成既定目标又是一种。每种奖励的权重、时间窗口、与情境的绑定关系,都精细得像瑞士钟表。
而我们的AI训练目标是什么?"预测下一个词"。
它不知道这个词背后是真实的人,还是机器生成的废话;不知道这句话会让人开心还是生气;不知道说出这句话后,世界会变得更好还是更糟。它只有一个粗糙的"准不准"的评分。
就像教孩子学钢琴,只告诉他"弹对音符就给糖",却不告诉他"音乐是为了表达情感"。他也许能把贝多芬弹得一个音不错,但永远不会理解为什么那首曲子能让人流泪。
草蛇灰线:从果蝇大脑开始的伏笔
Marblestone不是空谈者,他在行动。他提到FlyWire项目——把果蝇全脑的14万个神经元、5000万个突触一一标注出来。这听起来像是在数星星,但真正的野心在别处:他想找到那张"方向盘的设计图纸"。
皮层与皮层下结构如何分工?哪些回路负责生成训练信号?这些信号如何与抽象表征对接?这些问题的答案,也许就埋在果蝇那颗芝麻大的大脑里。
这有点像红楼梦里的伏笔。开头写"石头"来历,看似无关紧要,直到最后一页才明白,原来整本书的命运早已写在那块石头上。
连接组学就是那个"石头"。它记录的不是智能如何工作,而是智能如何被引导。如果AI的引擎已经够大了,那么剩下的工作,就是找到那张方向盘的设计图纸,然后按图施工。
FRO:为科学种下一棵大树
但这件事太难了。学术界像一片碎片化的草地,每个研究小组都在自己的小角落里种花,很少有人愿意花十年时间做"基础设施建设"。产业界又太急功近利,等不起十年的回报。
于是Marblestone想到了第三种模式:FRO(Focused Research Organization)。它像一支"创业式科研团队",目标清晰、时间有限、资源集中。他们不追求发论文的数量,而是盯着那些"一旦做成,就能改变整个游戏规则"的基础设施。
这像什么?像在荒原上种树。不是种一株就能活一株的那种,而是先挖一口深井,把水系建起来,然后整片森林才能长出来。
神经追踪平台、药物—靶点数据门户、可穿戴全脑超声接口——这些项目听起来很分散,但指向同一个主题:把领域缺失的"关键工具"补起来,让整个科学树干更粗。
结局:方向盘与引擎,缺一不可
那么,规模路线错了吗?不,大模型的成功令人惊叹。只是Marblestone在提醒我们,引擎再大,没有方向盘也会翻车。
想象一个未来的AI系统,它有两层结构:底层是像皮层一样的世界模型,能从海量数据中学习抽象规律;上层是像皮层下一样的价值系统,有一套精细、分层、阶段性启用的训练信号。底层问"这个世界是怎么运作的",上层说"这些东西里,哪些值得你在乎"。
这样的系统,不会只为了"预测下一个词"而训练,它会问:这句话会让人信任还是害怕?这个决策会让世界更公平还是更不公?这个推理符合逻辑还是违背常识?
价值不再是一个事后打上去的补丁,而是学习本身的一部分。
尾声:方向盘的哲学
最后,让我们回到那个开车的人。
他为什么需要方向盘?不是为了控制,而是为了选择。引擎提供力量,方向盘提供方向。力量越大,方向越重要。
AI也是如此。当它的引擎强到能影响真实世界时,方向盘就不能只是一根粗糙的木棍。它需要是人类进化几百万年后,才终于写清楚的那份"什么值得追求"的答案。
这份答案不在数据里,不在架构里,而在连接皮层与皮层下那些看不见的回路里。
找到它们,也许比再扩大十倍模型更有意义。
本文受启发于Adam Marblestone关于"转向与驱动机制"的思考,融合神经科学、复杂系统与认知美学的视角。