AI算力基础设施的去中心化——从GPU霸权到ASIC群雄并起

发布时间:2026/6/25 19:29:44
AI算力基础设施的去中心化——从GPU霸权到ASIC群雄并起 2026年6月全球AI芯片市场迎来了几个标志性事件。当地时间6月24日英伟达召开年度股东大会CEO黄仁勋宣告“有用的AI时代”已经到来并将这一轮计算范式转变定性为“60年来规模最大的行业重置”。同一天OpenAI与博通联合发布首款自研推理芯片Jalapeño宣称可将推理成本降低约50%。也正是在这一天高通在纽约投资者日活动上正式宣布全面进军AI数据中心市场微软和Meta双双成为其首批客户。三件大事同频共振映射出一个正在加速兑现的产业判断AI算力基础设施正在经历一场深刻的去中心化变革。英伟达GPU的统治地位并未被颠覆但一个多元化、多极化的算力新格局已然成形。一、推理时代从“训练军备竞赛”到“推理成本战争”理解这场变革首先要看清一个根本性的需求结构转变。2023年推理仅占AI总算力需求约三分之一到2026年这一比例已升至三分之二。预计到2028至2030年推理将占AI总算力需求的70%至85%。AI产业的底层逻辑正从实验室里的“不计代价训练”转向面向全球用户的“极致推理成本战”。为什么这一转变如此关键训练是大规模并行的矩阵运算可以在数万个GPU核心上同时进行这正是GPU的绝对优势领域。但推理尤其是代理式AIAgentic AI的推理涉及任务编排、工具调用、多步逻辑判断和顺序决策。这些工作负载并非纯粹的并行计算而是大量依赖CPU擅长的复杂逻辑控制与串行处理能力。黄仁勋在股东大会上给出了一个精辟的比喻传统数据中心存储和传输文件而AI工厂的核心功能是“制造token”——每一个token都是可货币化的智能单元。在这一逻辑下竞争的关键维度不再是“谁的芯片算力最强”而是“谁的token成本最低、吞吐量最高”。推理需求爆发带来的直接后果是云服务商发现继续用昂贵的GPU跑推理惊人的电费与采购成本正在吞噬利润。摩根大通在最新报告中指出推动这场转变的根本因素甚至不是资金成本而是电力供应——在电力日益吃紧的背景下“每瓦效能”正成为AI时代最关键的竞争指标。二、ASIC崛起从“小众替代品”到“主力玩家”正是在这一背景下定制ASIC芯片迎来了爆发式增长。市场研究机构TrendForce的数据显示2026年云服务商自研ASIC的出货增速预计达44.6%首次大幅超越GPU的16.1%--。2024年和2025年GPU的成长表现原本仍领先ASIC而这个增速拐点的出现意味着ASIC已从“小众替代品”成长为AI算力市场的主力玩家之一。摩根大通的预测更为激进2026年ASIC占全球AI芯片出货量的比重约为42%2027年将一举达到53%正式超越GPU。该行预计2026年ASIC出货量年增109%远高于GPU约39%的增速。各大云厂商的自研芯片正在全面铺开。谷歌TPU出货量预计从2026年的450万颗跳升至2027年的800万颗亚马逊Trainium系列从190万颗增至330万颗微软与Meta的自研芯片也进入量产阶段。谷歌已向苹果、Meta等企业开放TPU算力租赁服务。亚马逊更是与AI巨头Anthropic签下十年合约后者承诺未来10年花费超过1000亿美元购买AWS算力服务且全数绑定在Trainium系列自研AI芯片上。在AI推理市场中ASIC份额预计将从2024年的15%增长至2026年的40%-。TrendForce预测2026年AI服务器中定制芯片的渗透率将从2025年的20.9%提升至27.8%而GPU市场份额则从75.9%下降至69.7%-。三、Jalapeño的启示最大客户开始“自己造芯”在所有ASIC案例中OpenAI的Jalapeño芯片最具象征意义。自2022年生成式AI热潮兴起以来OpenAI一直是英伟达最大的GPU买家之一。而如今这家头号客户正亲手打造替代方案。Jalapeño由OpenAI工程师与博通联合设计耗时仅九个月完成流片是一款专为大语言模型推理设计的全新架构而非对早期AI加速器的改造。博通CEO陈福阳称Jalapeño的性能可与英伟达Blackwell芯片和谷歌TPU相媲美-。早期测试显示Jalapeño的每瓦性能“显著优于”当前最先进的芯片。基于Jalapeño的系统预计于2026年底前以吉瓦级规模首次部署。OpenAI总裁布罗克曼表示“Jalapeño是我们长期全栈基础设施战略的一部分旨在让算力变得更加充足。”这一合作的战略意义不止于芯片本身。博通提供了Tomahawk网络芯片及芯片实现技术伟创力负责板卡、机架和系统集成。OpenAI还与亚马逊AWS就Trainium芯片达成协议并与AMD和Cerebras展开合作——这是一项有意为之的多元化战略旨在摆脱对单一供应商的依赖。摩根大通预测博通凭借深度参与谷歌TPU、Meta MTIA以及OpenAI定制芯片项目其来自AI ASIC与网络业务的营收将从2026年约600亿美元在2027年增长逾倍至1500亿美元以上。博通管理曾透露2027年在手订单金额已超过1000亿美元。四、高通入局手机芯片巨头的数据中心野望如果说OpenAI造芯是“客户自研”的样本那么高通的全面入局则是“新玩家跨界”的标志性事件。6月24日高通在纽约投资者日上正式发布面向AI数据中心市场的Dragonfly产品家族涵盖CPU、AI加速器和数据中心互联解决方案。最重磅的消息来自Meta——CEO扎克伯格亲自确认高通将成为Meta未来的数据中心CPU供应商。Meta将采用Dragonfly C1000数据中心CPU及后续产品世代双方签署的是覆盖多个产品周期的长期战略合作协议。与此同时微软Azure宣布部署高通的高带宽计算HBC芯片。值得注意的是高通HBC方案依托的是手机、笔记本通用的平价普通内存而非英伟达使用的高价HBM高带宽内存。高通预计数据中心业务最快将在2027财年带来数十亿美元收入。高通CEO安蒙表示“AI正在从数据中心扩展到边缘设备和终端设备整个行业需要新的计算架构来支撑这种变化。”高通将Dragonfly定位为“智能体AI时代的数据中心计算平台”这一定位与英伟达Vera Rubin“为智能体打造”的表述形成了直接对标。高通还同步宣布以接近40亿美元的全股票交易收购AI初创公司Modular-。Modular拥有一套可跨芯片运行AI模型的软件技术无需为每种处理器单独编写代码-。这笔收购被视为高通在软件层面直接挑战英伟达CUDA生态的关键布局。五、英伟达的护城河还坚固吗面对ASIC的围攻和高通的突袭英伟达的统治地位是否正在松动从市场份额看英伟达依然占据绝对优势。SemiAnalysis数据显示2026年第一季度英伟达在AI训练芯片市场占有率为92%推理芯片市场占有率为78%与一年前几乎持平-。IDC估计英伟达控制着约81%的AI芯片市场份额-。即便市场份额预计到2026年将下降至约75%但绝对收入仍在增长因为整体市场扩展速度远快于任何单一竞争者的捕获能力-。黄仁勋在股东大会上强调英伟达系统的核心优势不在于采购价格最低而在于“最低token成本、最高token吞吐量和最强收入能力”。Blackwell平台被第三方评测认定为“推理之王”token吞吐量较次优平台高出30倍。Vera Rubin已全面投产每个主要的模型开发商、公有云和超大规模云厂商都准备基于Vera Rubin进行建设。但护城河正在被侵蚀而非被摧毁。摩根大通认为尽管英伟达GPU出货量仍会持续增长但市占率势必遭到稀释。CNBC的报道也指出行业专家普遍认为英伟达的风险目前仍然很小但“英伟达对AI芯片市场的控制力正在受到考验”-。更深层的变化在于客户关系的重构。过去所有AI公司都是英伟达的客户现在谷歌、亚马逊、微软、Meta、OpenAI——这些曾经最大的买家——正在变成英伟达的竞争对手。它们不再只是单纯采购现成芯片而是逐步建立属于自己的芯片生态。六、新格局从“单极世界”到“多极生态”AI算力基础设施正在从“单极世界”走向“多极生态”。这个新格局呈现几个鲜明特征第一市场蛋糕在持续扩大而非简单的存量博弈。AI加速器市场2025年约为1600亿美元2026年正朝向2000亿美元以上迈进-。TrendForce预测2026年全球AI服务器出货量将年增20%以上-。即便英伟达份额下降其收入绝对值仍在增长。第二“CPUGPUASIC”的三极算力格局正在形成。在AI训练阶段CPU与GPU的配置比例通常维持在1:8的极端状态。而进入推理时代后这一比例正快速拉近至1:1到1:2之间。英伟达自身也在2026年3月承认“CPU正在成为AI工作流中的瓶颈”——这来自一家以“GPU是AI唯一需要的芯片”为产业信念的公司。第三软件生态成为新的竞争高地。英伟达的CUDA生态被黄仁勋称为“皇冠珠宝”。高通收购Modular、推出全栈数据中心方案正是试图在软件层面打破CUDA的垄断-。未来芯片战争的胜负手可能不在于硬件性能的毫厘之差而在于谁能构建更完善的开发者生态。第四竞争从芯片延伸到整个基础设施堆栈。黄仁勋以“五层蛋糕”描述AI产业——能源、芯片与系统、基础设施、模型、应用。英伟达的业务覆盖远不止芯片而是贯穿整个AI生产链条。高通也在构建“CPUAI加速器网络”的全栈方案。未来的赢家将是能提供完整基础设施堆栈的企业而非单一的芯片供应商。2026年6月24日这一天英伟达在股东大会上看多AI基建OpenAI发布自研芯片挑战GPU高通跨界入局数据中心——三件事同频共振共同指向一个清晰的产业趋势AI算力基础设施的去中心化已经不可逆转。英伟达不会在一夜之间失去王座但垄断的时代正在远去。一个由GPU、ASIC、CPU共同驱动的多极化算力新时代已然拉开帷幕。对于云厂商和AI企业而言这意味着更多的选择、更低的成本和更强的议价能力对于整个AI产业而言这意味着更快的创新速度和更可持续的发展路径。正如黄仁勋所言这轮AI基建周期“将以数十年为单位来衡量”——而在这场长达数十年的长跑中多元化的算力生态或许比任何单一霸主的统治都更具生命力。