2026 年东京 Sakana AI 发布 Fugu:多模型协作或成 AI 新前沿,挑战单一模型霸权

发布时间:2026/6/22 22:09:43
2026 年东京 Sakana AI 发布 Fugu:多模型协作或成 AI 新前沿,挑战单一模型霸权 发布信息2026 年 6 月 22 日东京 AI 公司 Sakana AI 正式发布了 Fugu——“用一个模型指挥所有模型”的多 Agent 编排系统。Fugu 的核心赌注是 AI 能力的下一步提升来自让多个已有模型协同工作而非造出更大的单一模型。公司背景2023 年 7 月在东京成立三位联合创始人各代表稀缺能力维度。CEO David Ha 是前 Google Brain 研究科学家曾领导 Stability AI 研究团队CTO Llion Jones 是《Attention Is All You Need》合著者之一Transformer 架构出自该研究小组COO Ren Ito 曾任职于日本外务省为公司提供政府关系和地缘政治判断力。公司在 2024 年 9 月完成约 2 亿美元 A 轮融资后成日本估值最高 AI 独角兽2025 年 11 月以约 26 亿美元估值完成 1.35 亿美元 B 轮融资投资者包括 Khosla Ventures、Lux Capital、NEA、NVIDIA、三菱 UFJ 金融集团和三井住友银行。核心研究路线是“从自然界获取灵感的可持续 AI”。技术原理将两篇 ICLR 2026 论文——TRINITY 和 Conductor 的研究成果打包成 OpenAI 兼容 API 端点。Fugu 内部轻量级协调器动态挑选 Thinking、Working、Verifying 三种角色的 Agent拆分、委托、验证、整合任务并返回结果过程对用户不可见、不可配置。Fugu 架构是学习出来的协调系统TRINITY 论文贡献轻量级协调器Conductor 论文通过强化学习让协调器发现 Agent 通信模式和提示策略使 LLM 池集体表现超个体模型。协调策略是机器摸索出的最优协作模式因此 Sakana AI 不公开具体模型列表和路由策略。产品变体Fugu 分为两个变体。Fugu 在性能和延迟间取平衡面向日常编码、分析和聊天场景Fugu Ultra 使用更深更大 Agent 池固定参与模型不可剔除目标是提升答案质量调用时内部并行触发多次推理、验证、合成耗时和 Token 消耗高于 Fugu。定价策略Fugu Ultra 多个 Agent 同时工作时计费基于最高一档费率“不叠加计费”策略降低开发者对多 Agent 系统隐性成本的恐惧。测试数据Fugu Ultra 在多个基准测试中表现出色。在 SWE Bench Pro 上得分 73.7 超越 Opus 4.8 的 69.2 和 GPT - 5.5 的 58.6仅次于 Anthropic 的 Fable 5 和 Mythos Preview在 TerminalBench 2.1 上得分 82.1 超过 Fable 5在 LiveCodeBench Pro 上得分 90.8在 GPQA - D 上拿到 95.5在 Humanitys Last Exam 上以 50.0 与 Fable 5 持平。且未使用 Anthropic 最新模型证明多模型系统不包含最强单一模型也能追平或超越。定性展示六个演示案例中Fugu Ultra 在 BPB 优化任务上降低损失盲棋对弈击败前沿模型和 Stockfish 引擎CAD 机械光圈设计产出可用曲柄连杆机构交易模拟实现 19.43% 累计收益优于对比模型。这些任务多步骤、需多轮验证单模型易出错。用户口碑早期用户反馈良好。软件工程师称 Fugu Ultra 代码审查比 GPT - 5.5 好平台架构负责人强调 Fugu 长会话“人设稳定性”出色安全工程师用 Fugu 完成完整安全评估流程研究人员报告 Fugu 自主运行近四小时几乎无需人类干预。地缘政治意义Fugu 发布时机有地缘政治意味Sakana AI 提及 Anthropic 模型出口管制事件认为单供应商依赖是脆弱性。Fugu 的 Agent 池可替换能动态绕过受限模型Sakana AI 称其为“AI 主权”在亚太市场有受众。美国 AI 公司出口限制为日本、韩国和欧洲替代方案创造市场空间。定价结构Fugu 定价结构分两轨。订阅轨面向个人和团队Standard 每月 20 美元Pro 100 美元Max 200 美元均可同时使用 Fugu 和 Fugu Ultra。企业按量付费轨中Fugu 按底层模型公开费率计费Fugu Ultra 输入价格每百万 Token 5 美元上下文超 272K 时翻倍输出价格每百万 Token 30 美元超长上下文时 45 美元缓存输入 0.50 美元。六月订阅可获第二个月免费企业 Token 优先级高于订阅用户。目前 Fugu 在欧盟和欧洲经济区不可用公司正推进 GDPR 合规工作。产业意义Fugu 代表 AI 产业发展方向转折信号。2023 - 2025 年行业认为“更大的模型 更好的结果”2026 年上半年事件推动新共识形成下一个前沿是让现有模型更聪明协作。Fugu 是新共识下首个封装为标准化 API 产品能否持续超越编排模型最佳者需更多验证但已将学术概念变为可调用服务。开发者是否愿为“黑箱协调器”支付溢价答案将在后续使用数据中浮现。