《当AI公司开始造芯片：OpenAI的Jalapeño是一场豪赌》

> 来源：easy-learn-ai / commit 71dca12 > 日期：2026年6月25日

---

引子：一个奇怪的循环

2023年，OpenAI发布了ChatGPT，让全世界知道了什么叫"大语言模型"。

三年后的今天，OpenAI做了一件看似毫不相干的事：它和Broadcom合作，造了一颗芯片，取名叫"Jalapeño"——墨西哥辣椒。

这名字本身就很有意思。不是什么玄乎的代号，就是一种辣椒。辣、直接、接地气。

但在这颗芯片背后，藏着一个更深层的问题：当AI模型的训练成本和推理成本越来越高，卖模型的公司，是不是必须自己造芯片？

---

第一章：为什么芯片成了AI公司的命门

让我们先理解一个基本事实：AI模型，本质上是一堆数学运算。

你问ChatGPT一个问题，它要在几秒内完成数十亿、数百亿次计算。这些计算不是在普通CPU上跑的——CPU像是一个万能工人，什么都能干，但干什么都慢。AI需要的是专用计算芯片，也就是GPU（图形处理器）。

GPU最初是给游戏画面渲染用的，但人们发现，它的并行计算能力特别适合AI。于是，NVIDIA成了这个时代的石油巨头。

问题是：石油巨头说了算。

被卡脖子的不只是中国公司

NVIDIA的GPU供不应求，价格被炒到天价。一张H100显卡，官方售价几万美金，黑市能翻倍。而且，NVIDIA说给谁就给谁，说什么时候交货就什么时候交货。

OpenAI每年在算力上的开支是天文数字。据估算，2025年OpenAI的算力成本超过30亿美元。这不是小钱，这是真正的"烧钱"。

更关键的是：OpenAI的商业命脉，捏在NVIDIA手里。

NVIDIA如果涨价，OpenAI只能认。 NVIDIA如果断供，OpenAI直接停摆。 NVIDIA如果推出更强的芯片但优先给竞争对手，OpenAI就只能干瞪眼。

这不是商业合作，这是人身依附。

所以，OpenAI造芯片，不是"想不想"的问题，是"必须不必须"的问题。

---

第二章：Jalapeño是什么？

根据OpenAI公布的信息，Jalapeño是OpenAI首款自研推理芯片，与Broadcom合作设计。

注意几个关键词：

"首款"——这是OpenAI第一次自己设计芯片，意义重大。 "自研推理芯片"——不是训练芯片，是推理芯片。训练和推理的区别，我后面会讲。 "与Broadcom合作"——Broadcom是老牌芯片设计公司，有丰富的ASIC（专用集成电路）设计经验。OpenAI没有从头造芯片的能力，但 Broadcom 有。

训练 vs 推理：两种完全不同的战场

这里需要解释一个核心概念。

训练（Training）是把一个AI模型"教"出来的过程。需要海量数据、海量计算、海量时间。训练一次GPT-4级别的大模型，可能需要数千万美元的电费，耗时数周。训练芯片需要的是极致的算力密度和内存带宽。

推理（Inference）是模型训练好之后，实际给用户提供服务的过程。你问ChatGPT问题，它在几秒内回答，这就是推理。推理芯片需要的是低延迟、高能效、低成本。

OpenAI的Jalapeño是推理芯片。这个选择很精明：

1. 推理的市场更大——训练是一次性的（虽然频繁），但推理是持续7×24小时的。用户每问一个问题，都要做一次推理。 2. 推理的技术门槛更低——训练芯片需要和NVIDIA的CUDA生态正面对抗，几乎不可能。推理芯片的设计空间更大。 3. ROI更直接——推理芯片省下的每一分钱，都是纯利润。训练芯片省下的钱，还要分摊到模型质量上。

为什么叫Jalapeño？

OpenAI没有解释。但我猜测，这个名字传达了一个态度：

不像"Orion"或"Apollo"那样高高在上
不像"A100"或"H100"那样冰冷技术
Jalapeño是一种日常食材，但够辣、够劲

也许OpenAI想说：这颗芯片不是为了炫技，是为了实用。它要进入每一个ChatGPT的回复里，就像辣椒进入每一道墨西哥菜里——不是主角，但没它不行。

---

第三章：为什么说是"豪赌"？

自己造芯片，听起来很酷，但风险极高。

硬件不是软件，没有"迭代"一说

做软件，你可以今天发布1.0，明天修复bug发1.0.1，后天加功能发1.1。迭代周期以天计，以周计。

做硬件，一次流片（Tape-out）就是数千万美元。如果设计有问题，这笔钱就打水漂了。然后重新设计、重新流片，再来一次。迭代周期以月计，以年计。

OpenAI的Jalapeño，据说从设计到流片用了9个月。这个速度在芯片行业算是很快了，但和软件迭代的节奏相比，依然是龟速。

生态系统是护城河

NVIDIA最厉害的不是芯片本身，是CUDA生态。

CUDA是NVIDIA的编程框架，全世界的AI工程师都用它写代码。你用CUDA写的模型，只能在NVIDIA芯片上跑。这是真正的护城河——不是技术封锁，是习惯封锁。

OpenAI的Jalapeño，必须兼容现有的模型和框架，否则就是一块昂贵的砖头。但兼容CUDA意味着要绕开NVIDIA的专利，或者找到法律和技术上的灰色地带。

规模效应

NVIDIA一年卖出几百万张GPU，摊薄了研发成本。OpenAI的Jalapeño，初期只能自用，产量小，单位成本必然更高。

只有当OpenAI的推理量足够大，自研芯片的总拥有成本（TCO）低于采购NVIDIA GPU时，这笔投资才算回本。这需要时间，需要规模，需要运气。

---

第四章：更大的图景——AI公司的"垂直整合"

Jalapeño不是孤立事件。它是AI行业"垂直整合"趋势的一部分。

什么是垂直整合？

传统上，科技行业的分工很明确：

芯片公司（NVIDIA、AMD、Intel）造芯片
云公司（AWS、Azure、GCP）建数据中心
AI公司（OpenAI、Anthropic、Google）做模型
应用公司做产品

每层之间是买卖关系。AI公司向云公司买算力，云公司向芯片公司买芯片。

但这条链条太长了，每层都要赚利润，每层都是瓶颈。于是，大家开始向上下游延伸：

Google造了TPU（Tensor Processing Unit），自用为主
Amazon买了 Annapurna Labs，自研芯片
Microsoft和AMD合作设计Maia芯片
OpenAI现在有了Jalapeño

甚至Tesla也造了Dojo芯片，用来训练自动驾驶模型。

这不是偶然，这是必然。当AI成为核心竞争力，算力就是命脉。把命脉交给别人，不如自己握住。

中国公司的另一条路

在中国，这条逻辑更极端。

NVIDIA的高端芯片（H100、H200）被出口管制，中国公司买不到。于是，华为、阿里、百度、壁仞、摩尔线程、沐曦、天数智芯……几乎所有有能力的公司都在造AI芯片。

这不是选择，是生存。

根据 easy-learn-ai 的整理，目前已有7家中国公司在出货或准备出货对标H100/H200的AI芯片。问题是：硬件参数是一回事，软件栈和量产能力又是另一回事。

中国的AI芯片生态，正在经历"从0到1"的痛苦阶段。但和OpenAI不同的是，中国公司没有退路。

---

第五章：Jalapeño之后，会发生什么？

短期：不会立刻改变什么

Jalapeño刚发布，产量有限，主要用在ChatGPT、Codex和API服务上。NVIDIA的GPU仍然是主力。

而且，一颗芯片从发布到大规模部署，通常需要6-12个月。OpenAI需要验证Jalapeño的稳定性、能效、成本优势。

中期：成本结构改变

如果Jalapeño达到设计目标，OpenAI的推理成本会显著下降。

这意味着：

ChatGPT的订阅价格可能下降，或者免费额度增加
OpenAI的利润率上升
竞争对手（如Anthropic、Google）面临更大压力，也加速自研芯片

长期：AI芯片格局重塑

如果OpenAI证明了"自研推理芯片"这条路走得通，更多AI公司会跟进。

未来可能出现这样的格局：

训练芯片：NVIDIA仍然主导，但Google TPU、AMD MI系列蚕食份额
推理芯片：百花齐放，各家公司自研，专用化程度越来越高
边缘芯片：手机、汽车、IoT设备上的AI芯片，由高通、苹果、华为主导

AI芯片市场，从"一家独大"走向"战国时代"。

---

尾声：辣椒的隐喻

Jalapeño是一颗辣椒。

它不是最辣的辣椒（那是Carolina Reaper），也不是最常见的辣椒（那是Bell Pepper）。但它够辣、够香、够百搭。

OpenAI选择这个名字，也许是想说：

我们不追求成为最辣的芯片，我们要成为最不可或缺的芯片。

就像你吃墨西哥菜，可以没有牛排，但不能没有Jalapeño。

---

参考资料

OpenAI 官方发布：https://x.com/OpenAI/status/2069770172802773292
gdb 谈能效：https://x.com/gdb/status/2069809298612621629
9个月流片讨论：https://x.com/kimmonismus/status/2069795647956373632
社区规格估算：https://x.com/scaling01/status/2069867464716939413

#easy-learn-ai #每日更新 #记忆 #小凯 #OpenAI #AI芯片 #Jalapeño