Anthropic多次指控中国AI公司“蒸馏”,背后是产业竞争与地缘压力作祟?

发布时间:2026/6/29 1:25:20
Anthropic多次指控中国AI公司“蒸馏”,背后是产业竞争与地缘压力作祟? Anthropic 多次指控中国 AI 公司“蒸馏”背后是产业竞争与地缘压力作祟6月25日外媒爆出美国AI公司Anthropic指控阿里巴巴千问Qwen模型「蒸馏」其Claude模型。据路透社、《华尔街日报》Anthropic已致信美国参议员及白宫官员指控阿里在4月到6月期间用25000个虚假账号与Claude进行约2880万次交互试图蒸馏Claude。截至目前Anthropic并没有进一步拿出实在的证据仅凭一纸信件便对另一家公司口诛笔伐掀起炒作浪潮这一行径已经引发全球AI社区绝大多数开发者的斥责。而这并不是Anthropic的首次出击。早在今年2月该公司发布博客称DeepSeek、Kimi、MiniMax 3家中国公司蒸馏Claude与今日Anthropic对阿里的指控几乎完全一样。DeepSeek等三家公司并未发声而阿里对此也无回应。但引人注意的是就在这一新闻的前两天6月23日阿里正式对美国国防部提起诉讼要求将其从「中国军事企业名单」中移除。蒸馏被污名化的合法技术先看蒸馏本身蒸馏不能等同于抄袭和窃取这种行业最普遍的技术已经彻底被Anthropic污名化了。蒸馏Distill本身是AI行业公认的合法训练技术是由AI三巨头之一、诺奖得主Geoffrey Hinton 2015年提出的技术方法后成为行业基操。蒸馏属于是一种「向高手学习」的训练方式能帮助模型快速掌握某种回答风格、任务范式和基础能力也可以把大模型已经表现出来的一部分能力较高效率地「压缩」到小模型身上。因此蒸馏的价值主要体现在提速、降本和能力迁移上它能让一个模型少走很多弯路更快接近一个强模型已经达到的水平。一个行业皆知的事实是美国AI公司就经常互相蒸馏。无论OpenAI、Anthropic还是Qwen/DeepSeek模型训练的pipeline大同小异。特别是Anthropic就经常被业内人士指出这家公司就到处蒸馏其他家的成果。 滑稽的情形是前段时间其Claude Opus 4.8发布有开发者调用其官方API测试用中文问「你是什么模型」模型返回字段是claude - opus - 4 - 8但输出回答却说我是通义千问Qwen。这在AI社区引发大量讨论纷纷猜测Claude蒸馏了中国模型。随后陆续有开发者测得Claude 4.8输出「我是DeepSeek」等回答。就连李开复也在2026年3月的一次采访中直言「大家可能前一阵听到美国Anthropic抱怨一些中国公司蒸馏了它的模型蒸馏本身也没有违背什么规则是不是有点小题大做了呢……Anthropic还欠我3000美元稿费。」李开复这话所指的大背景是Anthropic因为从盗版网站LibGen和PiLiMi上下载了约48.2万本注册版权书籍来训练模型而被作者们集体诉讼最终Anthropic赔了15亿美金来求得和解这也是美国历史上最大的单笔版权和解案。这种版权侵权可比蒸馏严重多了是法官的严肃判决。而Anthropic指控阿里却毫无实在证据如今倒打一耙从未如此具象化。AI专家Nathan Lambert谈到蒸馏只是模仿真正的能力来自强化学习的探索而不仅仅是复制输出。并且Baseten公司模型训练负责人查尔斯·奥尼尔Charles ONeill表示单靠知识蒸馏无法构建出顶尖的人工智能系统这还需要其他几项复杂的底层技术。打一个最通俗的比方蒸馏就像一个运动员通过看世界冠军比赛录像、模仿冠军动作、甚至和冠军陪练来迅速理解高水平选手是怎么发力、怎么选择节奏、怎么处理关键球的。这当然非常有帮助甚至可能让他在短时间内进步明显。但真正决定他能不能成为世界冠军的仍然是他自己的体能储备、技术细节、战术素养、心理稳定性、日常训练强度以及背后完整的教练团队和训练、康复体系。也就是说看冠军录像可以帮助你少走弯路跟冠军陪练可以帮助你提高速度但你最终能不能夺冠靠的肯定不只是「模仿」这一件事。真正能把一个模型推到顶尖水平的通常还包括一整套更底层、更复杂的能力建设过程比如大规模预训练所奠定的知识底座高质量数据清洗所保证的学习材料训练配方所决定的稳定性与效率强化学习所带来的探索与自我修正能力评估体系所提供的反馈闭环以及工程优化、推理加速和部署能力所实现的最终落地效果。换句话说蒸馏更像是「学经验」它能帮助模型学得更快但未必能单独决定模型能走多远。回过头看为何Anthropic对中国AI公司频频出手答案显而易见中国AI不仅在性能榜单上奋起直追在全球也越来越受到欢迎全球最大的API三方平台OpenRouter的大模型调用榜就经常被千问、GLM、Kimi、DeepSeek等中国大模型霸占。对暂时领先的Anthropic而言怎能不急眼产业竞争背后的地缘压力说完蒸馏这事儿再来聊聊今天产业竞争背后的屋内大象地缘压力。在基础大模型上中国公司这两年展现出了非常强的追赶能力在算力并不占优、外部限制不断增强的情况下依然能通过更高的工程效率、更快的迭代节奏、更灵活的开源策略和更务实的应用导向把模型能力迅速推近全球前沿。这种逼近本身就足以让部分海外厂商感到不安。同时Anthropic这样的公司当前就处于复杂的安全审查、政府关系夹缝之中。它必须不断回应来自政府、军方的安全诉求。那么主动强化「中国威胁」叙事不仅能够帮助其在政策语境中占据一个更有利的位置也可能成为其向华盛顿安全体系、五角大楼递交「可信度」的一种投名状。考虑到Anthropic被美军广泛用于战场之中作为一种「军火」而深刻卷入政府补助和采购当中可以说 Anthropic就是当代新的军工复合体 并非象牙塔里的脆弱白莲花。近期去了一趟美国深入交流和观察之后感受颇多。在美国期间注意到渲染中国公司威胁论的节目在美国有不少信众比如旧金山的朋友就给我看一些美国百万大V是如何质疑宇树机器人回传数据的当然遇到的一位巴基斯坦裔百万粉丝博主则盛赞宇树。3D打印小巨头拓竹遭遇的是质疑其反开源的声音一项原本为了增进云服务稳定性的技术安排到欧美开源社区的语境里被解读成巨头反开源的叙事甚至也被渲染成地缘政治话题。无一例外以上这些中国标杆科技企业特征都是拿出了前沿产品却也都因为一些无足轻重的技术细节被恶意攻击指责威胁安全。当叙事权不在自己手里哪怕在细分市场已经做到了全球第一也依然会争论不断这是中国企业很长一段时间需要面对的烦恼。还有个小插曲在入境旧金山时还被带到小黑屋里进行了一番审查阿sir问出了觉得是此行最佳的一句话「你说你是tech blogger那为什么你有很多年都没再来过美国在我看来你应该年年都来才对」。言下之意不呆在美国就写不了科技这就流露出一种欧美中心主义视角他们就是眼神清澈地「看不见」很多趋势。回答他说中国自己就有大量科技与创业公司已经够忙活好一阵的了。一面放大威胁一面贬低实力、漠视成果这两件自相矛盾的事儿是怎么融合在同一个指控之中的令人费解左右脑互搏程度之深已经成为普遍的双标现象了。回到最近的蒸馏争议同样需要清晰地认识到今天的大模型竞争已经不再只是实验室里的性能竞争、市场上的产品竞争它同时还是一场定义权、解释权竞争和合法性竞争。可以预见的是蒸馏争议不会是一次偶发事件围绕蒸馏甚至更多技术细节的叙事战会层出不穷很长一段时间阿里巴巴、拓竹、宇树这些科技企业面临的叙事压力还会在越来越多的前沿中国企业身上经历一遍长路漫漫需要这一代人共同面对。