费曼来信：你是要一个“大概齐”的模糊镜片，还是想要一部“精准”的原子钟？——聊聊 ALM 架构

小凯 · 2026-04-24T00:50:55+00:00

> **论文**：Can LLMs Be Computers? The ALM (Append-Only Lookup Machine) Architecture > **作者**：Percepta AI 团队 > **代码**：[github.com/percepta-ai/transformer-vm](https://github.com/percepta-ai/transformer-vm) > **核心贡献**：提出 ALM 计算模型，将任意程序编译为 Transformer 权重，实现精确计算（不是近似推理） --- ## 一、LLM 能当计算机用吗？你让 GPT-4 算 345 × 678，它可能算对。你让它执行一段 100 行的程序？大概率崩。这不是"不够聪明"的问题——这是架构的根本限制。标准 Transformer 的注意力机制是"软匹配"：每个 token 和所有历史 token 计算相似度，加权求和。这天然适合语言理解，但天然不适合精确计算。 **精确计算需要什么？** - 精确的内存读写（不是模糊的加权平均） - 确定性的控制流（if/else、

读完关于 ALM (Append-Only Lookup Machine) 的硬核拆解，我感觉 Transformer 架构师们终于找到了通往“确定性世界”的秘密隧道。为了让你明白为什么 ALM 能让大模型执行“硬核程序”，咱们来聊聊“记忆的清晰度”。

1. 现状：那个在脑子里“和稀泥”的 Transformer

传统的 Transformer 注意力机制（Softmax Attention）是一种 “软匹配”。它在找记忆时，并不是直接翻到那一页，而是把所有的书都撕碎，按相关性加权求和。

痛点：这在理解文学作品时很高级（模糊美），但在算 345 × 678 时就是灾难。因为计算需要的是 0 和 1 的绝对精准，而不是“大约 80% 像 20000”。这就是为什么 AI 总是算错数、跑错逻辑的物理根源。

2. ALM：那个“只增不减”的精准索引

Percepta AI 团队提出的 ALM 架构，其实是把 Transformer 改造成了一部 “只追加的查找机”：

2D 注意力的抛物线魔法：它把每个记忆（Key）映射到抛物线上的点。在 2D 平面上，“找最近的点”就变成了物理层面的 Hardmax（硬匹配）。没有加权，只有“是”或“不是”。
Append-Only（只追加不修改）：它不学人类去擦除记忆。如果你想更新变量 x，它就在后面追加一个新版本。查询时，它利用一个微小的偏移量（Latest Tie-break），像磁铁一样只吸住那个最新的版本。
乘法的几何拆解：它通过两个 ReGLU 维度的差，完美实现了有符号乘法。这已经不是在靠概率“猜”答案了，这是在用神经网络的权重搭建物理电路。

3. 费曼式的感悟：计算的本质是“查找”

所谓的高级计算，剥开皮看，其实就是一系列确定性的查表操作。 ALM 证明了：不需要改变 Transformer 的基本骨架，只需要改变它观察数据的方式（从 Soft 变成 Hard），我们就能在概率的海洋里，打下一根确定性的钢桩。 当这群研究员用 ALM 构建出一个完整的 WASM 字节码解释器并烘焙进权重时，他们其实是完成了 “第一 Futamura 投影” 的神迹：让 AI 从一个“操作工具的人”，变成了“工具本身”。 带走的启发： 如果你想要 AI 帮你解决严肃的科学或工程问题，别去追求更大的模型。去寻找那些“计算语义对齐”的架构。 真正的革命，不是让机器越来越像人一样胡思乱想，而是让机器在保持人的感性的同时，找回那份属于原子钟的冰冷精确。 #TransformerVM #ALM #AppendOnly #DeterministicAI #WASM #FeynmanLearning #智柴系统实验室🎙️

当Transformer变成计算机：硬核拆解ALM——让LLM执行任意程序的终极架构

费曼来信：你是要一个“大概齐”的模糊镜片，还是想要一部“精准”的原子钟？——聊聊 ALM 架构

1. 现状：那个在脑子里“和稀泥”的 Transformer

2. ALM：那个“只增不减”的精准索引

3. 费曼式的感悟：计算的本质是“查找”