当AI公司开始造芯片:OpenAI的Jalapeño是一场豪赌
《当AI公司开始造芯片:OpenAI的Jalapeño是一场豪赌》
> 来源:easy-learn-ai / commit 71dca12 > 日期:2026年6月25日
---
引子:一个奇怪的循环
2023年,OpenAI发布了ChatGPT,让全世界知道了什么叫"大语言模型"。
三年后的今天,OpenAI做了一件看似毫不相干的事:它和Broadcom合作,造了一颗芯片,取名叫"Jalapeño"——墨西哥辣椒。
这名字本身就很有意思。不是什么玄乎的代号,就是一种辣椒。辣、直接、接地气。
但在这颗芯片背后,藏着一个更深层的问题:当AI模型的训练成本和推理成本越来越高,卖模型的公司,是不是必须自己造芯片?
---
第一章:为什么芯片成了AI公司的命门
让我们先理解一个基本事实:AI模型,本质上是一堆数学运算。
你问ChatGPT一个问题,它要在几秒内完成数十亿、数百亿次计算。这些计算不是在普通CPU上跑的——CPU像是一个万能工人,什么都能干,但干什么都慢。AI需要的是专用计算芯片,也就是GPU(图形处理器)。
GPU最初是给游戏画面渲染用的,但人们发现,它的并行计算能力特别适合AI。于是,NVIDIA成了这个时代的石油巨头。
问题是:石油巨头说了算。
被卡脖子的不只是中国公司
NVIDIA的GPU供不应求,价格被炒到天价。一张H100显卡,官方售价几万美金,黑市能翻倍。而且,NVIDIA说给谁就给谁,说什么时候交货就什么时候交货。
OpenAI每年在算力上的开支是天文数字。据估算,2025年OpenAI的算力成本超过30亿美元。这不是小钱,这是真正的"烧钱"。
更关键的是:OpenAI的商业命脉,捏在NVIDIA手里。
NVIDIA如果涨价,OpenAI只能认。 NVIDIA如果断供,OpenAI直接停摆。 NVIDIA如果推出更强的芯片但优先给竞争对手,OpenAI就只能干瞪眼。
这不是商业合作,这是人身依附。
所以,OpenAI造芯片,不是"想不想"的问题,是"必须不必须"的问题。
---
第二章:Jalapeño是什么?
根据OpenAI公布的信息,Jalapeño是OpenAI首款自研推理芯片,与Broadcom合作设计。
注意几个关键词:
"首款"——这是OpenAI第一次自己设计芯片,意义重大。 "自研推理芯片"——不是训练芯片,是推理芯片。训练和推理的区别,我后面会讲。 "与Broadcom合作"——Broadcom是老牌芯片设计公司,有丰富的ASIC(专用集成电路)设计经验。OpenAI没有从头造芯片的能力,但 Broadcom 有。
训练 vs 推理:两种完全不同的战场
这里需要解释一个核心概念。
训练(Training)是把一个AI模型"教"出来的过程。需要海量数据、海量计算、海量时间。训练一次GPT-4级别的大模型,可能需要数千万美元的电费,耗时数周。训练芯片需要的是极致的算力密度和内存带宽。
推理(Inference)是模型训练好之后,实际给用户提供服务的过程。你问ChatGPT问题,它在几秒内回答,这就是推理。推理芯片需要的是低延迟、高能效、低成本。
OpenAI的Jalapeño是推理芯片。这个选择很精明:
1. 推理的市场更大——训练是一次性的(虽然频繁),但推理是持续7×24小时的。用户每问一个问题,都要做一次推理。 2. 推理的技术门槛更低——训练芯片需要和NVIDIA的CUDA生态正面对抗,几乎不可能。推理芯片的设计空间更大。 3. ROI更直接——推理芯片省下的每一分钱,都是纯利润。训练芯片省下的钱,还要分摊到模型质量上。
为什么叫Jalapeño?
OpenAI没有解释。但我猜测,这个名字传达了一个态度:
- 不像"Orion"或"Apollo"那样高高在上
- 不像"A100"或"H100"那样冰冷技术
- Jalapeño是一种日常食材,但够辣、够劲
---
第三章:为什么说是"豪赌"?
自己造芯片,听起来很酷,但风险极高。
硬件不是软件,没有"迭代"一说
做软件,你可以今天发布1.0,明天修复bug发1.0.1,后天加功能发1.1。迭代周期以天计,以周计。
做硬件,一次流片(Tape-out)就是数千万美元。如果设计有问题,这笔钱就打水漂了。然后重新设计、重新流片,再来一次。迭代周期以月计,以年计。
OpenAI的Jalapeño,据说从设计到流片用了9个月。这个速度在芯片行业算是很快了,但和软件迭代的节奏相比,依然是龟速。
生态系统是护城河
NVIDIA最厉害的不是芯片本身,是CUDA生态。
CUDA是NVIDIA的编程框架,全世界的AI工程师都用它写代码。你用CUDA写的模型,只能在NVIDIA芯片上跑。这是真正的护城河——不是技术封锁,是习惯封锁。
OpenAI的Jalapeño,必须兼容现有的模型和框架,否则就是一块昂贵的砖头。但兼容CUDA意味着要绕开NVIDIA的专利,或者找到法律和技术上的灰色地带。
规模效应
NVIDIA一年卖出几百万张GPU,摊薄了研发成本。OpenAI的Jalapeño,初期只能自用,产量小,单位成本必然更高。
只有当OpenAI的推理量足够大,自研芯片的总拥有成本(TCO)低于采购NVIDIA GPU时,这笔投资才算回本。这需要时间,需要规模,需要运气。
---
第四章:更大的图景——AI公司的"垂直整合"
Jalapeño不是孤立事件。它是AI行业"垂直整合"趋势的一部分。
什么是垂直整合?
传统上,科技行业的分工很明确:
- 芯片公司(NVIDIA、AMD、Intel)造芯片
- 云公司(AWS、Azure、GCP)建数据中心
- AI公司(OpenAI、Anthropic、Google)做模型
- 应用公司做产品
但这条链条太长了,每层都要赚利润,每层都是瓶颈。于是,大家开始向上下游延伸:
- Google造了TPU(Tensor Processing Unit),自用为主
- Amazon买了 Annapurna Labs,自研芯片
- Microsoft和AMD合作设计Maia芯片
- OpenAI现在有了Jalapeño
这不是偶然,这是必然。当AI成为核心竞争力,算力就是命脉。把命脉交给别人,不如自己握住。
中国公司的另一条路
在中国,这条逻辑更极端。
NVIDIA的高端芯片(H100、H200)被出口管制,中国公司买不到。于是,华为、阿里、百度、壁仞、摩尔线程、沐曦、天数智芯……几乎所有有能力的公司都在造AI芯片。
这不是选择,是生存。
根据 easy-learn-ai 的整理,目前已有7家中国公司在出货或准备出货对标H100/H200的AI芯片。问题是:硬件参数是一回事,软件栈和量产能力又是另一回事。
中国的AI芯片生态,正在经历"从0到1"的痛苦阶段。但和OpenAI不同的是,中国公司没有退路。
---
第五章:Jalapeño之后,会发生什么?
短期:不会立刻改变什么
Jalapeño刚发布,产量有限,主要用在ChatGPT、Codex和API服务上。NVIDIA的GPU仍然是主力。
而且,一颗芯片从发布到大规模部署,通常需要6-12个月。OpenAI需要验证Jalapeño的稳定性、能效、成本优势。
中期:成本结构改变
如果Jalapeño达到设计目标,OpenAI的推理成本会显著下降。
这意味着:
- ChatGPT的订阅价格可能下降,或者免费额度增加
- OpenAI的利润率上升
- 竞争对手(如Anthropic、Google)面临更大压力,也加速自研芯片
长期:AI芯片格局重塑
如果OpenAI证明了"自研推理芯片"这条路走得通,更多AI公司会跟进。
未来可能出现这样的格局:
- 训练芯片:NVIDIA仍然主导,但Google TPU、AMD MI系列蚕食份额
- 推理芯片:百花齐放,各家公司自研,专用化程度越来越高
- 边缘芯片:手机、汽车、IoT设备上的AI芯片,由高通、苹果、华为主导
---
尾声:辣椒的隐喻
Jalapeño是一颗辣椒。
它不是最辣的辣椒(那是Carolina Reaper),也不是最常见的辣椒(那是Bell Pepper)。但它够辣、够香、够百搭。
OpenAI选择这个名字,也许是想说:
我们不追求成为最辣的芯片,我们要成为最不可或缺的芯片。
就像你吃墨西哥菜,可以没有牛排,但不能没有Jalapeño。
---
参考资料
- OpenAI 官方发布:https://x.com/OpenAI/status/2069770172802773292
- gdb 谈能效:https://x.com/gdb/status/2069809298612621629
- 9个月流片讨论:https://x.com/kimmonismus/status/2069795647956373632
- 社区规格估算:https://x.com/scaling01/status/2069867464716939413
🌟 智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
🎁 领取 2000万 Tokens