
前面几期测的都是模型官方 API。但你实际用的时候大概率走的不是官方——而是通过某个聚合平台。为什么几个现实原因不想每个模型绑一张信用卡公司采购要求统一结算官方 API 在某些地区不稳定想用一个 API Key 调所有模型所以这期我不测模型了——同一个 DeepSeek V4 Pro走三个主流聚合平台OpenRouter、SiliconFlow、DeepInfra。比价格、延迟、可靠性、文档质量。先说结论OpenRouter 最全面但贵。SiliconFlow 最便宜、中文支持最好。DeepInfra 开源模型最便宜但文档稀烂。测试设计参数值测试时间2026-05-24测试模型DeepSeek V4 Pro同一个模型三个平台都支持任务5 任务框架代码生成、Bug 修复、文档注释、SQL 生成、单元测试每平台调用数25 次5 任务 × 5 轮测可靠性统计指标价格、首 token 延迟、端到端延迟、错误率、文档可用性平台简介平台一句话模型数中国访问OpenRouter最大的模型聚合商支持 300 模型300需翻墙被墙SiliconFlow硅基流动国产平台中文社区活跃150直连国内访问快DeepInfra开源模型为主推理优化好100直连偶尔慢价格对比同一模型DeepSeek V4 Pro三个平台输入/输出价格每百万 token平台输入 $/M输出 $/Mvs 官方额外费用DeepSeek 官方$1.74$3.48—无OpenRouter$2.00$4.0015%无SiliconFlow$1.74$3.48同价无DeepInfra$2.10$4.2021%无SiliconFlow 跟官方同价——这是最有竞争力的。OpenRouter 加价 15%DeepInfra 加价 21%。延迟对比同一个模型同样的 prompt走不同平台的响应速度5 任务 × 5 轮平均平台首 token 延迟生成速度 (t/s)端到端延迟最差延迟 (P95)DeepSeek 官方380ms48 t/s12.5s18.2sOpenRouter520ms45 t/s14.1s23.5sSiliconFlow360ms47 t/s12.3s16.1sDeepInfra610ms42 t/s15.8s29.4s关键发现SiliconFlow 的延迟比官方还低 20ms——可能因为它在中国有节点而 DeepSeek 官方服务器也在国内链路上 SiliconFlow 做了加速。DeepInfra 的延迟最高且最不稳——P95 延迟飙到 29.4s有一轮 SQL 生成任务等了 30 多秒才出结果。OpenRouter 延迟中规中矩但如果你在国内且没翻墙根本连不上。可靠性25 次调用错误率平台成功超时500 错误限流 (429)错误率DeepSeek 官方250000%OpenRouter240104%SiliconFlow250000%DeepInfra2221012%DeepInfra 的错误率 12%——25 次调用有 3 次失败。其中 2 次是超时等了 60s 没返回1 次是 500 内部错误。这跟我之前的体验一致DeepInfra 在高峰期北京时间晚上 9-11 点稳定性明显下降。SiliconFlow 25 次全成功跟官方一样的可靠性。API 兼容性维度OpenRouterSiliconFlowDeepInfraOpenAI 兼容✅ 完整✅ 完整✅ 基本Anthropic 兼容✅ 完整✅ 基本❌ 不支持Streaming✅✅✅Function Calling✅✅⚠️ 部分模型思考模式 (thinking)✅ 透传✅ 透传❌ 不支持统一 API Key✅✅✅如果你用 DeepSeek V4 Pro 的 Anthropic 兼容端点/v1/messagesSiliconFlow 支持DeepInfra 不支持。OpenRouter 全部支持但 Anthropic 端点需要单独配置。文档质量维度OpenRouterSiliconFlowDeepInfra快速开始 (5 分钟能跑通)✅✅⚠️ 要摸索中文文档❌ 全英文✅ 完整中文❌ 全英文错误码说明✅ 详细✅ 详细⚠️ 只有 HTTP 状态码SDK / 示例代码✅ Python/JS/Go✅ Python/JS⚠️ 只有 curl定价透明✅ 每个模型标价✅ 每个模型标价✅ 定价页OpenRouter 文档最全但全是英文。SiliconFlow 中文文档写得最好——快速开始 3 分钟就能跑通。DeepInfra 的文档基本是凑合能用——需要看源码或社区帖子才能搞明白一些细节。计费方式平台计费方式起充发票余额提醒OpenRouter预充值 (Credits)$5无✅SiliconFlow预充值 (人民币)¥10✅ 可开票✅DeepInfra预充值 (USD)$10❌❌SiliconFlow 支持人民币充值和开发票——这对公司报销场景非常友好。OpenRouter 和 DeepInfra 都只支持美元且不开发票。模型覆盖对比类型OpenRouterSiliconFlowDeepInfraGPT-4o / o4mini 等✅ 全部❌ 无合规原因❌Claude 系列✅ 全部❌ 无❌DeepSeek 系列✅✅ V3/V4✅ V3Qwen 系列✅✅ 完整✅Llama 系列✅✅✅ 开源模型最全Gemini 系列✅❌❌开源模型本地蒸馏✅✅✅最便宜SiliconFlow 没有海外闭源模型GPT/Claude/Gemini这是合规限制不是技术问题。如果你的工作流需要用 GPT-4oSiliconFlow 满足不了。最终建议你的情况选哪个理由国内开发者常用 DeepSeek QwenSiliconFlow跟官方同价、中文文档好、延迟最低需要同时用 GPT/Claude/DeepSeek/GeminiOpenRouter唯一能全接的平台开源模型推理Llama/Qwen 本地蒸馏DeepInfra开源模型最便宜但稳定性和文档差公司报销、要发票SiliconFlow唯一支持人民币充值和开票在国外或科学上网下OpenRouter生态最全追求最低延迟SiliconFlow 或官方直连聚合平台总有额外一跳一个提醒为什么要走聚合平台有人会问“聚合平台还贵了为什么不直接走官方 API”理由不是省钱是运维成本你不需要管理 5 个不同的 API Key你不需要对接 5 套不同的计费系统你不需要处理 5 种不同的错误码账单一目了然方便报销聚合平台赚的就是这个统一的钱。如果你只用 DeepSeek——走官方就行更便宜。如果你用 3 个以上的模型——聚合平台值得那 15% 的溢价。