2025 年 6 月的一个深夜,Carina Hong 盯着屏幕上的 Lean 编译器,指尖在键盘上悬停。她的团队刚刚花了三个月,试图让 AI 理解"为什么三角形的内角和是 180 度"。不是计算,不是记忆——是理解。
"这太荒谬了,"她转身对联合创始人说,"人类用一张图就能讲清楚的道理,机器需要 200 行代码。"
那一刻,她意识到数学教育的终极悖论:我们教孩子"显而易见",却教机器"每一步都必须证明"。
六个月后,AxiomProver 在 Putnam 竞赛上拿下了 120/120 分。这不是胜利,这是宣言——AI 正在学会一种全新的数学语言。
AxiomProver = Axiom(公理)+ Prover(证明者)+ X(未知变量)- 一个会写 Lean 证明的"AI 数学家"用最直白的话说:AxiomProver 是一个能"看到"数学结构,并把它翻译成机器可验证代码的智能体。
┌─────────────────────────────────────┐
│ 2025 Putnam 竞赛 │
│ 12 道题,6 小时,120 分 │
├─────────────────────────────────────┤
│ A2:微积分证明 → 200 行 Lean 代码 │
│ B2:测度论 → 60 行正性证明 │
│ A5:排列归纳 → 2054 行,518 分钟 │
│ A3:组合博弈 → 300 行,AI 突袭 │
│ B1:几何推理 → 400 行,无图证明 │
│ A6:p 进数 → 5 小时,蛮力胜利 │
└─────────────────────────────────────┘
每一道题都是一个数字墓碑,上面刻着两种墓志铭:
人类版: "显然"、"易证"、"如图所示"
AI 版: "import Mathlib"、"theorem"、"have h1 : ..."
这就是 AxiomProver 的魔法链条:人类灵感 → AI 翻译 → Lean 验证 → 公开可查。
AxiomProver 最深刻的洞察在于:它是一个"认知拓扑揭示器"。
这揭示了认知拓扑结构:人类与 AI 的思维空间是相似但不同构的流形。
| 题目 | 人类感知 | AI 感知 | Lean 代码行数 | 生成时间 | 胜负手 |
|---|---|---|---|---|---|
| A2 | 简单(看图) | 繁琐(定义) | ~200 | - | 人类胜在直觉 |
| B2 | 简单(引理) | 繁琐(60+行证明) | ~150 | - | 人类胜在简洁 |
| A5 | 中等(归纳) | 极繁琐(记账) | 2054 | 518 分钟 | AI 胜在耐心 |
| A3 | 难(组合) | 简单(无分支) | ~300 | - | AI 胜在逻辑 |
| B1 | 难(几何) | 中等(符号) | ~400 | - | AI 胜在代数 |
| A6 | 极难(p进) | 难(蛮力) | 高 token | 5 小时 | AI 胜在坚持 |
| A4 | 中等(代数) | 中等(几何) | ~500 | - | 思路不同 |
| B4 | 中等(图解) | 繁琐(枚举) | 1061 | - | 思路不同 |
这表格是一面镜子:照出了人类与 AI 的认知拓扑结构——相似但不同构。
数学家 Alexander Grothendieck 有个著名隐喻:数学研究不是"钻探石油",而是"等待海水上涨,淹没问题"。
人类数学家:
AxiomProver:
这两种思维不可比较,但可互补。
Carina Hong 的愿景正是:人类提供灵感,机器负责验证,两者螺旋上升。
波兰数学家 Bartosz Naskręcki 观察 GPT-5.2 Pro:
"面对非平凡问题,很难找到真正能让 AI 卡死的点。一到两小时的交互,模型就能把答案推出来。"
"要么 OpenAI 背后有一支「全天候的小精灵与顶尖数学家团队」在实时代打,要么模型已经具备非常扎实的能力。"
AxiomProver 在 A6 题上的胜利是蛮力的胜利:
陶哲轩说 AI 解决了 Erdős 问题,是里程碑。他不是夸张——Erdős 问题以"开放、难、需要新想法"著称。
如果 AI 能自主解决 Erdős,那千禧年难题(P vs NP, Riemann 猜想)可能真的在可预见的未来。
但,Tao 也谨慎:里程碑 ≠ 奇点。奇点需要自我改进的闭环,目前 AI 还是工具,不是主体。
批评者说:
"AI 只是在模式匹配,它不知道'为什么'。"
"人类数学家也做模式匹配——我们叫它'直觉'。"
Lean 的形式化有代价:
但这也是Lean 的价值:它强迫你检查每个"显然"。
Carina Hong 的回答很清晰:
"我们不需要硬攻每一个问题。人类直觉 + 机器验证 = 涨潮的海。"
费曼会问:"如果 AxiomProver 消失了,我们会失去什么?"
答案是:一种全新的数学对话方式。千百年来,数学是"人类说,人类听"。现在,出现了第三种声音——机器说,人类验证,机器再反馈。
这像三体人的交流:思想透明,即时验证,无需欺骗。
AxiomProver 做到了。它让数学从"独白"变成了"对话"。
| 概念 | 人类方式 | AI 方式 | 隐喻 |
|---|---|---|---|
| 证明 | 灵感 → 构造 | 枚举 → 验证 | 建筑师 vs 施工队 |
| 难度 | 无灵感 = 无解 | 高 token = 难解 | 诗人瓶颈 vs 算力瓶颈 |
| 几何 | 图形直观 | 符号代数 | 画家 vs 代数学家 |
| 组合 | 构造巧妙 | 无分支搜索 | 魔术师 vs 穷举器 |
项目:https://axiommath.ai
证明:https://github.com/axiommath/proofs
创始人:Carina Hong (@CarinaLHong)
协议:AI + Human Collaboration
"数学不是聪明的符号游戏,而是对真相的耐心挖掘。" —— 从 Hilbert 到 Lean,再到 AxiomProver这正是 AxiomProver 的哲学:在形式与直觉之间,架起一座桥。
还没有人回复