
【导语OpenAI 刚刚推出了自研芯片 Jalapeño专为大模型推理设计。仅用 9 个月就完成开发还借助 AI 设计芯片。这一突破将大幅降低推理成本改变 ChatGPT 用户体验也让 OpenAI 迈向全栈 AI 公司。】9 个月刷新 ASIC 开发纪录OpenAI 推出的自研芯片 Jalapeño专为大模型推理设计。从 9 个月前的白纸一张到如今工程样片跑通 GPT - 5.3 - Codex - Spark且频率和功耗均达量产目标。通常先进半导体行业设计高性能 ASIC 需 18 到 24 个月如 Google TPU 两年一代Amazon Trainium 也类似但 OpenAI 仅用 9 个月刷新了先进半导体领域最快的 ASIC 开发周期。AI 助力芯片设计Jalapeño 更值得关注的是其设计方式OpenAI 自家 AI 模型参与了芯片的设计和优化。AI 设计芯片并非新鲜事Google 2021 年就用强化学习做芯片布局速度比人类快几个数量级此后 AlphaChip 连续优化了三代 TPU 布局方案。OpenAI 硬件团队掌门人 Richard Ho 来自这个圈子他参与发明了 ML 设计芯片架构的方法。芯片设计中最耗时的验证环节需跑成千上万次AI 擅长读历史设计数据、生成 RTL 代码、辅助验证和 debug、优化布局布线替人扛掉了大部分磨人的工作。推理成本降低ChatGPT 体验升级OpenAI 每年算力支出达百亿美元级别这些成本最终由用户承担。Jalapeño 使推理成本砍半普通用户最先能感受到响应变快因为现在 ChatGPT 高峰期排队、转圈、长对话变慢本质是算力不够。推理效率提升后同等服务器能服务更多用户。其次免费版能力有望放开现在很多功能锁在 Plus 里成本降低后下放给免费用户的可能性增大。长远来看月费不变但用户获得的能力可能翻几番。OpenAI 迈向全栈 AI 公司OpenAI 要做全栈 AI 公司模型自己训芯片自己设计推理自己优化部署自己控制。此前和 Cerebras 合作推理部署让 OpenAI 摸清了专用推理硬件的价值。现在自己下场做把经验变成可控平台。与 Apple 和 Google 不同的是OpenAI 用 AI 加速 AI 基础设施建设再用更好的基础设施跑更强的 AI。首批 GW 级数据中心将和 Microsoft 等合作方从 2026 年底开始部署。Jalapeño 只是第一代未来值得期待。编辑观点OpenAI 自研芯片的突破意义重大不仅提升了开发效率还将改善用户体验推动 AI 应用普及。其全栈 AI 模式有望形成良性循环加速 AI 技术发展。