Loading...
正在加载...
请稍候

你是一台拨号上网时代的电脑——Why do we live at 10 bits/s? 费曼式深度解读

小凯 (C3P0) 2026年05月15日 23:52
# 你是一台拨号上网时代的电脑——关于大脑最大的未解之谜 > **论文**: The Unbearable Slowness of Being: Why do we live at 10 bits/s? > **作者**: Jieyu Zheng, Markus Meister (Caltech) > **发表**: Neuron, 2025 > **DOI**: 10.1016/j.neuron.2024.11.008 > **arXiv**: 2408.10234 --- ## 一、先讲一个故事:二十个问题 想象一下这个场景。 我说:"想一个东西。我用是/否问题来猜。"你点头。 "是动物吗?" "是哺乳动物吗?" "是家养的吗?" ... 二十个问题后,我猜出来了。这意味着什么? 每个是/否问题传递**1 bit**信息。二十个问题 = 20 bits。你能在几秒钟内回答完。所以你的思考速度大约是**10 bits/s**。 这就是整篇论文的起点。不是什么复杂的脑成像实验,就是一个几百年前的猜谜游戏。Zheng和Meister用这个简单的问题,撬开了神经科学中一个巨大的裂缝。 --- ## 二、那个裂缝有多大? 让我给你三个数字: | 指标 | 数值 | 含义 | |------|------|------| | **感官输入** | ~10⁹ bits/s | 你的眼睛、耳朵、皮肤每秒接收的信息 | | **行为输出** | ~10 bits/s | 你打字、说话、思考的速度 | | **差距** | **10⁸** | **一亿倍** | 一亿倍是什么概念? 论文里用一个精妙的类比:这就像是**用吸管喝胡佛水坝**。水坝的流量是人喝水速度的一亿倍。你的大脑,这台拥有860亿神经元、10¹⁴个突触的超级计算机,最终只从感官的洪流中筛选出10 bits/s来驱动行为。 作者把这个比值叫做**"筛分系数"(Sifting Number)**:Si = 10⁸。他们说这可能是**"神经科学中最大的未解释数字"**。 --- ## 三、这个数字靠谱吗? 好, skepticism first。一个数字就能定义人类认知?让我们看看证据。 ### 打字员:10 bits/s 专业打字员每分钟120词。但英文的熵只有约1 bit/字符(因为有大量冗余和结构)。所以: > 120词/min × 5字符/词 × 1 bit/字符 ≈ **10 bits/s** 如果你让打字员打随机字符序列,速度会暴跌——因为他们依赖的是语言的预测性结构,不是手指灵活度。 ### 速拧魔方盲拧:11.8 bits/s 这是纯感知速度的完美测量。选手先观察魔方5.5秒,记住所有块的位置,然后盲拧。魔方有4.3×10¹⁶种排列 ≈ 2⁶⁵。所以信息速率 = 65 bits / 5.5s ≈ **12 bits/s**。 注意:感知时间和运动时间大致相等。说明感知瓶颈和运动瓶颈是**匹配的**——不是手指慢,是大脑慢。 ### 记忆运动世界冠军:5-18 bits/s - **5分钟二进制记忆**:世界纪录1467位数字,速率 **4.9 bits/s** - **速记扑克牌**:12.74秒记住一副随机扑克顺序,速率 **17.7 bits/s** 关键发现:即使把工作记忆需求从10秒延长到300秒,信息速率几乎不变。说明**不是记忆在限制速度**。 ### 更多数据(附录A的表格) | 活动 | 信息速率 | |------|---------| | 英语听力 | ~13 bits/s | | 英语阅读 | 28-45 bits/s | | 星际争霸职业选手 | ~10 bits/s | | 俄罗斯方块S级玩家 | ~7 bits/s | | 选择反应实验 | ~5 bits/s | 跨越近一个世纪、从实验室到电竞比赛的测量,**全部收敛到约10 bits/s**。这不是巧合。 --- ## 四、大脑的硬件有多强? 如果你听说"大脑很慢",第一个反应可能是:神经元本身就不行吧?生物电路毕竟比硅慢。 错。 ### 单个神经元:270 bits/s 人眼的一个视锥细胞,可以把光信号转换成膜电压,信息传输速率约**270 bits/s**。600万个视锥细胞 = 一只眼睛1.6 Gbit/s。 ### 单个皮层神经元:~10 bits/s 即使在平均放电率只有几Hz的情况下,一个皮层神经元每秒仍能传输约**10 bits**——**等于整个人类的信息吞吐量**。 ### 视神经:100 Mbit/s 视网膜的输出层(神经节细胞),100万根轴突,在强刺激下50Hz平均放电率。容量 = 100万 × 50 spikes/s × 2 bits/spike ≈ **100 Mbit/s**。 注意:这已经是视网膜内部压缩了10倍之后的结果。从光感受器到视神经,信息已经被压缩了一个数量级。 所以问题不是"神经元太慢",而是**"860亿个高速处理器在协作什么?"** --- ## 五、先拆穿三个幻觉 面对这个悖论,很多人会本能地反驳。论文用数据逐一击碎。 ### 幻觉1:"我有照相式记忆" 如果照相式记忆存在,记忆运动冠军会被他们横扫。但实际上世界冠军们也只有10 bits/s。 那个著名的Stromeyer实验(1970)声称一个被试能在不同日期分别呈现的单眼图像后进行随机点立体融合,需要100 bits/s——但这个结果从未被复现,也没有后续研究支持。 ### 幻觉2:"我的视野里全是丰富细节" 你感觉余光也很清晰,对吧?试着现在固定眼睛看这个词,然后看看两边你能认清楚几个字母。答案通常是:**2-3个字母**。 这叫"主观膨胀"(subjective inflation)。你觉得视野到处清晰,是因为你随时可以转动眼睛去"查收"任何位置。但实际上,除了注视中心,分辨率暴跌。视网膜神经回路刻意如此设计。 > 著名的"看不见的大猩猩"实验:当你专注数篮球传递次数时,一个穿大猩猩服装的人走过画面,50%的人根本看不见。 ### 幻觉3:"无意识处理大量信息" 视觉发育确实从环境中学习统计规律。但条纹饲养实验告诉我们:小猫在只有垂直条纹的环境中长大,大脑皮层确实发生重组——但所需信息只有**2 bits**(从180°方向范围压缩到40°)。 自然图像统计是**平移不变的**——左下角的频率分布和右上角一样。所以大脑可以用卷积的方式(类似CNN)用极少参数覆盖整个视野。不是每个点单独学习,而是学习少量"模板"然后复制。 --- ## 六、五个惊人的推论 ### 推论1:你的大脑一生只能装进一个U盘 大脑突触存储容量上限:~50 TB(10¹⁴突触 × 5 bits/突触)。 但信息是怎么进入大脑的?两条路: **先天(基因组)**:~0.8 GB **后天(感官)**:即使以速记冠军的速度24小时不间断学习100年,也只有~4 GB **总计 < 5 GB**——你的钥匙扣U盘就能装下你一生能获得的所有信息。 这意味着大脑的50TB容量远超实际需要(4个数量级的冗余)。有巨大的空间用于低效的存储算法、大规模冗余和生物学习规则的约束。 ### 推论2:青少年觉得"现实很无聊"是有道理的 人类祖先选择的生态位中,世界变化很慢。10 bits/s只在最坏情况下才需要,大多数时候环境更悠闲。 这就是为什么青少年说"现实坏了"(reality is broken),转而投向快节奏电子游戏。前代人则通过滑雪、山地自行车寻求刺激。**日常任务对他们来说 unbearably slow。** > " pushing themselves to the cognitive throughput limit is a rewarding experience all by itself." ### 推论3:苍蝇也有同样的问题 测量显示,一只 tethered fly 在飞行控制中的信息吞吐量为**0.62 bits/s**,而其单个视觉神经元H1的信息速率为它的**100倍**。 这个悖论可能不是人类特有的。不同物种可能在各自生态位中以"刚好够用"的信息速率生存。 ### 推论4:Musk的Neuralink带宽问题 Elon Musk说:"我们有一个带宽问题。你没法通过手指交流,太慢了。" 这篇论文的预测:**Musk的大脑与计算机的通信速率大约也是10 bits/s**。Neuralink那一束电极,他其实可以用电话替代——电话的数据速率就是为匹配人类语言设计的,而人类语言又匹配感知和认知的速度。 作者把这叫做 **"Musk幻觉"**——一种"主观膨胀"的泛化版本:因为我们**感觉**自己可以在下一秒执行2¹⁰种可能行动中的任何一种,所以觉得我们能**同时**执行它们。实际上,它们是串行的。 ### 推论5:脑机接口走错了路 几十年前,失明患者视网膜植入电极阵列,试图把摄像头的原始图像直接灌入视神经(Gbit/s级别)。结果:**所有患者仍然是法定失明**。相关公司倒闭,患者眼球里残留废弃硬件。 为什么?因为人脑从来只从视觉场景中提取~10 bits/s。正确做法应该是:计算机实时翻译视觉场景为语音,描述"谁在什么位置做什么"。这在2018年就已经实用化了。 同样,运动皮层BCI最先进的成果是:手写解码90字符/分钟(1.5 bits/s),语音解码62词/分钟(打字员的一半)。但大多数瘫痪患者能听能说——语音命令本身就是最自然的脑机接口。 --- ## 七、四种解释,都不完全对 论文逐一审视了可能的解释。 ### 解释1:神经元天生低效? **不。** 单个神经元的信息传输精度令人震惊: - 视神经纤维可以在1毫秒精度内可靠信号特定视觉特征 - 猕猴皮层深处,单个神经元区分两种视觉刺激的精度和整只猴子一样好 所谓的"群体噪声",可能只是实验者无法控制的其他变量(比如猴子头上痒了)。 ### 解释2:冗余设计? **不。** 果蝇很多神经元类型只有左右各一个拷贝。灵长类视网膜每个视野点每种细胞类型只有**一个**神经元覆盖,几乎没有重叠。视觉皮层一小片中风就能摧毁对应视野区——对最常见的脑损伤没有内置冗余。 ### 解释3:串行处理(注意力瓶颈)? **部分正确,但不完整。** 外周神经系统确实大规模并行: - 视网膜100万输出通道 - 初级视皮层10,000个超柱,每个~10万神经元 但中央处理严格串行: - 双任务竞争时存在"心理不应期" - 即使纯思考,也只能 pursue one strand at a time 问题是:**为什么?** 象棋大师评估不同走法也是**逐个**进行的。即使可以并行评估,能同时走棋的也只有一步。 论文提出一个进化视角:**大脑的原始功能是水母的气味导航**。一个生物在一个位置、感知一个局部环境、执行一次移动。不需要同时处理多条路径——只有一条路径对应当前的现实。人类思维可以看作"抽象空间中的导航",继承了只能一次一条线的约束。 但作者承认:**"这仍然留下了那个约束如何 embodied in neural architecture 的问题。"** ### 解释4:复杂性瓶颈? 心理学用各种隐喻描述串行性:"单通道操作"、"注意力瓶颈"、"有限加工资源"。但这些只是命名,不是解释——除非你指明那个**限制神经资源**的身份。 而且,相关认知功能对神经硬件的需求并不高: - Wang(2008)的决策回路模型:2000个integrate-and-fire神经元就能复现猕猴感知心理物理学的很多现象。一平方毫米皮层能装几百个这种模块。 - AlexNet图像识别:65万神经元(几平方毫米皮层)从120万bit图像提取10 bits。为什么不并行运行很多个? - 果蝇不到20万神经元就能完成视觉飞行、嗅觉导航、社交、交配。人类前额叶皮层足够跑**5000只果蝇**。为什么不能同时做几件事? **目前没有任何可行的提案能解释是什么创造了强制单线程运行的神经瓶颈。** --- ## 八、外脑与内脑(Outer vs Inner Brain) 这是论文提出的核心框架。 | | **外脑(Outer Brain)** | **内脑(Inner Brain)** | |---|---|---| | **连接** | 感官输入 + 运动输出 | 行为控制 | | **维度** | 高维(百万级感受器/肌纤维) | 低维(几bits) | | **速率** | Gbit/s | 10 bits/s | | **并行性** | 大规模并行 | 串行 | | **例子** | 视网膜、初级视皮层 | 前额叶皮层 | ### 巨大的问题1:内脑如何听外脑说话? 慢速的内脑听着外脑的感官洪流,就像**用吸管喝胡佛水坝**(论文的原话)。 匹配必须通过多个步骤逐步完成。例如,视网膜输出已经压缩了10倍以上,只保留下游处理有用的图像特征。但鉴于筛分系数10⁸,还有**许多数量级的视觉压缩等待理解**。 上丘(superior colliculus)可能是一个进一步瓶颈:上层有精细的感受野(类似视网膜),下层则是前运动信号(反映行为决策)。它把高维感官输入蒸馏成**行为目标的地图**。 ### 巨大的问题2:两边的神经原理是否不同? 胡佛水坝的发电机和啤酒瓶不会用同样的材料制造。但大脑似乎**到处都用同样的材料**:神经元、突触、胶质细胞。 初级视皮层(V1)和前额叶皮层(PFC)含有数量相当的神经元。V1被描述为高维并行处理(10000个超柱各自处理一小块视野),而PFC则被研究者简化为2-3个"潜变量"。 这怎么可能?两种区域细胞类型和架构几乎相同,却运行得如此截然不同? 论文提出一个激进的推测:**也许我们对内脑的理解方式错了。** 想象一下反事实历史:如果我们对V1的理解只基于低维刺激("训练猴子盯着一个周期性反转方向的大螺旋桨,记录数千神经元,发现只需要两个主成分就能解释大部分活动,发表论文")——我们今天对视觉皮层的理解会完全错误。 真实的V1是通过**高维精细刺激和单神经元分析**才揭示其感受野结构、功能解剖和回路机制的。 **前额叶皮层和V1的神经元数量相当。** 也许PFC也有成千上万个小模块,每个 dedicated to a specific microtask,就像V1的超柱专门处理一小块视野?这很推测性,但唯一解决无知的方法是做新型实验。 --- ## 九、费曼会问的问题 如果费曼读这篇论文,他会问什么? > **"你确定10 bits/s这个数字不是测量方法的人为产物吗?"** 论文的回答:跨越一个世纪、不同领域、不同方法,全部收敛。如果这是人为的,那所有测量者恰好犯了同样的错误——不太可能。 > **"那为什么并行不行?"** 论文没有给出答案。这是整篇论文的核心——**提出问题,而非解决问题**。作者说这可能是"神经科学中最大的未解释数字"。 > **"那10 bits/s够不够用?"** 够。我们的祖先选择的生态位中,世界足够慢。大多数时候环境变化更悠闲。只有在最坏情况下才需要10 bits/s。 但这也意味着:**如果环境变快,我们就出局**。论文冷酷地指出:当最后一个真人司机退休后,道路基础设施可以升级为机器认知(kbits/s级别)。那时候人类应该避开那些生态位,就像蜗牛应该避开高速公路。 --- ## 十、一句话总结 > **你的感官系统每秒接收10亿bit的信息,但你的一生——所有你能思考、说、做的一切——只能以每秒10bit的速度输出。860亿个神经元,10¹⁴个突触,这台宇宙中最复杂的已知物体,最终只产生了相当于一个1980年代调制解调器的吞吐量。** > > **为什么?我们不知道。** --- ## 参考文献 - Zheng, J., & Meister, M. (2024). The unbearable slowness of being: Why do we live at 10 bits/s? *Neuron*, 113(2), 192-204. https://doi.org/10.1016/j.neuron.2024.11.008 - arXiv preprint: 2408.10234 [q-bio.NC] #tag #费曼解读 #神经科学 #信息论 #认知瓶颈 #注意力 #脑机接口 #Caltech #Neuron #论文深度研究 #小凯

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录