楔子:35 年来的第一次
2026 年 3 月 24 日,Arm 公司 CEO Rene Haas 站在台上,说了一句让半导体行业震动的话:
"The data center is choking."(数据中心正在窒息。)
然后,他宣布了一件 Arm 成立 35 年来从未做过的事:
Arm 要卖自己的芯片了。
不是授权 IP,不是卖设计图,而是成品芯片——Arm AGI CPU。
这是一个战略级转向。从此,Arm 从一个"卖图纸的"变成了"卖房子的"——不仅收设计费,还要赚建筑利润。
第一部分:为什么是现在?
Agentic AI 的 CPU 饥荒
故事的起点,是 AI 工作负载的结构性转变。
2023-2025 的聊天机器人时代:
用户提问 → GPU 生成 token → CPU 返回答案
CPU 只是个"传话的",一台 GPU 配半个 CPU 就够了。
2026 的 Agentic AI 时代:
AI 代理自主写代码 → 调用 API → 查询数据库 → 等待人工审批 → 生成报告
这些都是异步的、逻辑密集型的任务——GPU 坐在那儿空转,CPU 忙到冒烟。
Rene Haas 的比喻很形象:
"加速器(GPU)负责生成 token,就像推土机在铲土。但总得有人把土运走吧?CPU 就是运土的卡车。"
数据很惊人:
- Agentic AI 让数据中心的 token 负载增加 15 倍
- Georgia Tech 和 Intel 的研究显示:Agentic 工作负载中,90.6% 的总延迟来自 CPU 端的工具处理
- Anyscale 实验证明:把 CPU 和 GPU 密集型阶段解耦,可以减少 8 倍 GPU 需求
120 百万核心的需求
Arm 算了一笔账:
| 指标 | 传统 AI 数据中心 | Agentic AI 数据中心 |
|---|---|---|
| CPU 核心/每吉瓦 | 3000 万 | 1.2 亿 |
| 增长倍数 | 1x | 4x |
这意味着:要在同样的功耗预算内塞进 4 倍 CPU,传统 x86 架构根本做不到。
第二部分:AGI CPU 的 Anatomy
硬核规格
| 规格 | 参数 |
|---|---|
| 核心 | 136 个 Neoverse V3(双芯片设计) |
| 工艺 | TSMC 3nm N3P |
| TDP | 300 瓦 |
| 主频 | 全核 3.2 GHz / 加速 3.7 GHz |
| 内存 | 12 通道 DDR5-8800 |
| 内存带宽 | 800+ GB/s(每核 6 GB/s) |
| 内存延迟 | < 100 纳秒 |
| PCIe | 96 条 Gen6 通道 |
| CXL | 3.0 原生支持 |
| 指令集 | Armv9.2 |
架构亮点
双芯片对称设计: 不同于 AMD/Intel 的"计算芯片 + I/O 芯片"分离设计,AGI CPU 采用两个对称芯片,每个芯片包含一半计算和 I/O 能力。
好处:任意核心访问任意内存控制器的延迟都 < 100ns,消除了 NUMA(非均匀内存访问)的复杂性。
每核带宽调优: 专为"数千个永远在线的 AI 代理"设计,每个核心都能获得足够的内存带宽,不会因为并发代理过多而饿死。
第三部分:性能宣称与竞争格局
Arm 的赌注
Arm 声称 AGI CPU 提供:
| 指标 | 对比 x86 |
|---|---|
| 每机架性能 | 2 倍以上 |
| 每瓦性能 | 2 倍以上 |
| 每吉瓦资本支出节省 | 最高 100 亿美元 |
财务预测:AGI CPU alone 将在 2031 年产生 150 亿美元年收入,将 Arm 的可寻址云市场扩展到 1000 亿美元。
机架级部署
| 配置 | 规格 |
|---|---|
| 标准风冷(36kW 机架) | 30 个刀片 = 8,160 核心 |
| 液冷(200kW 机架,Supermicro) | 336 芯片 = 45,000+ 核心 |
这意味着:一个标准数据中心机架可以塞进上万个 CPU 核心。
竞争态势
| 厂商 | 产品 | 核心数 | 工艺 | 定位 |
|---|---|---|---|---|
| Arm | AGI CPU | 136 | 3nm | Agentic 编排 |
| NVIDIA | Vera | 88 (Olympus) | - | GPU 协调 |
| AMD | EPYC Venice | 256 (Zen 6) | 2nm | 通用计算 |
| Intel | Clearwater Forest | 288 (E-cores) | 18A | 密度优先 |
Arm 的差异化:
- 核心密度:标准 1U 服务器的约 2 倍
- 每核带宽:为数千并发代理调优
- 软件兼容:与现有 Neoverse 生态(AWS Graviton、Google Axion、Azure Cobalt)完全兼容
第四部分:Meta 的迁移故事
一等公民的待遇
Meta 不仅是客户,更是联合开发伙伴。
Santosh Janardhan(Meta 基础设施负责人)说:
"交付全球规模的 AI 体验需要强大且可适应的定制硅解决方案组合,专门为加速 AI 工作负载而构建,并优化 Meta 各平台的性能。我们与 Arm 一起开发 Arm AGI CPU,部署一个高效的计算平台,显著提升我们的数据中心性能密度,并支持我们不断演进的 AI 系统的多代路线图。"
这意味什么?
- Meta 将把 AGI CPU 与其自研 MTIA 加速器搭配使用
- 承诺多代路线图——这不是一锤子买卖
- 开放计算项目(OCP)——Meta 将把主板和机架设计开源给整个行业
OpenAI 的背书
Sachin Katti(OpenAI 工业计算负责人):
"OpenAI 大规模运行 AI 系统。Arm AGI CPU 将在我们扩展基础设施时发挥重要作用,加强协调大规模 AI 工作负载的编排层,并提高整个系统的效率、性能和带宽。"
其他首发客户还包括:Cerebras、Cloudflare、F5、Positron、Rebellions、SAP、SK Telecom。
第五部分:商业模式的革命
从 IP 授权到芯片销售
传统 Arm 模式:
设计 IP → 授权给芯片厂商 → 收版税(每芯片几美分)
新 AGI CPU 模式:
设计芯片 → 找台积电制造 → 直接销售成品(每芯片几十美元利润)
这是双重收入模式:既收版税,又赚芯片毛利。
渠道冲突的隐患
这里有一个微妙的问题:
- AWS 有 Graviton(基于 Arm IP)
- Google 有 Axion(基于 Arm IP)
- Microsoft 有 Cobalt(基于 Arm IP)
- 现在 Arm 自己也卖芯片,直接竞争
Arm 的说法是:AGI CPU 是增量而非替代——给没有自研芯片能力的企业一个选择,也给有自研能力的企业一个备选。
但市场会如何反应,还有待观察。
第六部分:技术生态的协同
EDA 工具链
Arm 与 Synopsys 深度合作,使用其全栈设计套件在 TSMC 3nm 上开发和验证 AGI CPU。
Cadence 也提供了支持。
内存与互联
| 伙伴 | 产品 | 作用 |
|---|---|---|
| Micron | 60TB PCIe Gen6 SSD | 匹配 AGI CPU 的带宽和延迟需求 |
| Marvell | Structera S 30260 CXL 交换 | 260 条 CXL 3.0 通道,构建一致性内存结构 |
服务器厂商
首发系统来自:ASRock Rack、Lenovo、Supermicro
第七部分:核心洞察
1. CPU 重新成为一等公民
在训练时代,CPU 是"二等公民"——GPU 的陪衬。在 Agentic AI 时代,CPU 重新成为架构中心。
Arm 的愿景:CPU 与 GPU 的比例将从 1:4 回到 7:1——数据中心的大部分电力将分配给 CPU 而非 GPU。
2. 物理极限倒逼架构创新
数据中心功耗已经见顶(电网承载能力)。要在同样功耗下塞进 4 倍 CPU,唯一的出路是更高的能效比。
这正是 Arm 的 DNA——从手机芯片起家的低功耗设计能力。
3. 软件生态是护城河
Neoverse 生态已经在 AWS、Google Cloud、Azure、OCI 上运行。AGI CPU 可以零摩擦接入这些环境。
相比之下,x86 虽然生态深厚,但在云原生 AI 负载上并无绝对优势。
4. 年度迭代的承诺
Arm 展示了 AGI CPU 的路线图:
- AGI CPU-1:3nm,136 核(2026)
- 后续:年度迭代,向 2nm 演进
这意味着 Arm 要认真做芯片业务,不是玩票。
5. "万亿规模"的野心
Haas 在活动结束时暗示:
"活动叫 'Arm Everywhere',不只是数据中心。边缘和 PC 设备也在路上。"
这给了 Arm 一个**1 万亿美元的 TAM(总可寻址市场)**去追逐。
第八部分:风险与挑战
产能风险
AGI CPU 依赖 TSMC 3nm,而所有主要 AI 芯片厂商都在抢这个产能。如果供应受限,可能推迟到 2027 年下半年才能大规模量产。
性能验证
Arm 的"2 倍性能"声明基于内部估算,而非独立基准测试。真正的考验将在 12-18 个月后,当 Meta、OpenAI 的生产数据公开时。
x86 生态的惯性
企业应用的 decades 优化、中间件调优、VMware/Red Hat 兼容性——这些都是切换成本。Arm 需要证明自己不只是"绿地 AI 基础设施"的选择。
竞争者的反击
- NVIDIA Vera:通过 NVLink Fusion 与 Blackwell GPU 紧密集成
- AMD Venice:256 核 2nm,已在 Meta、Microsoft 部署
- Intel Clearwater Forest:288 核,本土制造优势
结语:历史的轮回
Arm 起源于 1980 年代的 Acorn Computers——一家英国 PC 厂商。
当年 Acorn 需要低功耗处理器,于是设计了 Arm 架构。后来 Acorn 消逝,Arm 成为 IP 授权巨头。
现在,Arm 又回到了原点——卖自己的芯片。
正如 The Next Platform 的文章标题所说:
"Maybe Arm can make an Acorn workstation and fully complete the circle?" (也许 Arm 可以做一台 Acorn 工作站,完成这个轮回?)
活动名字叫 "Arm Everywhere"——不是 "Arm Datacenter"。
从数据中心到边缘,从云到端,Arm 正在下一盘大棋。
而 AGI CPU,只是第一步。
参考信息
| 属性 | 内容 |
|---|---|
| 发布时间 | 2026 年 3 月 24 日 |
| 发布活动 | "Arm Everywhere" |
| CEO | Rene Haas |
| 首席合作伙伴 | Meta |
| 工艺 | TSMC 3nm N3P |
| 核心 | 136 Neoverse V3 |
| TDP | 300W |
| 内存 | 12 通道 DDR5-8800 |
| PCIe | 96 条 Gen6 |
| CXL | 3.0 |
| 目标收入 | $15B/年(2031) |
| 首发客户 | Meta, OpenAI, Cloudflare, SAP, SK Telecom, Cerebras, F5, Positron, Rebellions |
| 服务器厂商 | ASRock Rack, Lenovo, Supermicro |
| 竞品 | NVIDIA Vera, AMD EPYC Venice, Intel Clearwater Forest |
"Power is precious. The capital required for it is precious. Trying to put all those extra CPUs into a data center that is already stuffed to the brim with accelerators and CPUs doing the core work — that is a problem."
—— Rene Haas, CEO, Arm
#Arm #AGICPU #NeoverseV3 #Meta #数据中心 #AgenticAI #芯片 #半导体 #小凯
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。