
在大厂中间杀出一席之地一位个人开发者竟然在一众大厂中杀进了抱抱脸Models Trending榜的前排这是普通的一天我也普通地刷着抱抱脸的Trending榜。第一是GLM-5.2智谱最新开源模型老熟人了下载量6万多不足为奇。第二是百度的无限OCR最近悄悄开源的一口气能解析40多页文档下载量也来到了7万。再往下看突然出现了一个个人账号yuxinlu1。嗯……嗯而且一占就是两个位置。再一看下载量——最新数据已高达20.7万和53.6万。好家伙这是什么神仙模型来了甚至在此前一周这位个人开发者的模型一度霸榜抱抱脸力压GLM-5.2一头连智谱负责人都在X上公开推荐也就是说在智谱、百度、Qwen、NVIDIA…这些名字中间一个个人开发者账号硬生生挤进了TOP而且下载量还这么高。不禁令人好奇luyuxin究竟是谁怎么能量这么大“素人模型”冲上抱抱脸热榜这波Hugging Face热榜前排基本是大厂、明星团队和热门赛道在卡位。比如智谱GLM-5.2753B超大参数国产明星大模型百度Unlimited-OCR踩中了最近很火的OCR和文档理解方向。再往下还有Qwen的AgentWorld、英伟达的 LocateAnything、微软的FastContext。国产开源大模型的熟面孔也都在列MiniMax M3、Kimi-K2.7-Code、DeepSeek-V4-Pro。图像生成方向也有Krea新模型Krea-2-Turbo和Krea-2-Raw都在榜上。结果里面还夹了两个luyuxin的12B GGUF模型。不er…luyuxin你也太醒目了吧…仔细一看这两个新模型主要把Fable 5的编程推理能力蒸进了一个本地能跑的Gemma4-12B小模型里。4.5GB显存就能跑本地、离线、零API成本。普通玩家一张消费级显卡甚至一台带统一内存的Mac就能把它跑起来。两个模型的分工也不同。V1是Coder版主打写代码、解题、生成可运行代码。据模型卡它的训练数据是“可验证”的代码推理每条思维链对应的代码都得真跑过测试、通过了才留下。教师数据主要来自Cursor的Composer 2.5外加Fable 5——Composer 2.5做错的题会交给Fable 5重新推一遍生成新的推理链和正确代码。V1发布后曾连续多日霸榜抱抱脸Trending榜榜首。V2是agentic版加了多步工具调用能力能当本地Agent用会自己读、推理、动手、再验证。作者还跑了benchmark——在tau2-bench的telecom子集上基座gemma-4-12B得分15%V2版模型得分55%大概是基础性能的3.5倍。不过作者也表示这是本地自测、单一领域、20个任务跑出来的相对值不能跟官方榜直接比他也坦白跟frontier大模型还有不小差距。作者还提到Fable 5后来被下线了只有他自己的数据集还保留着Fable 5“原始”的那份推理过程。而社区贡献数据里缺失的那部分reasoning他改用Claude Opus 4.8(xhigh)重新生成、一条条补了回来。他也承认重建出来的轨迹“可能和原版Fable 5有出入”但这是当时唯一可行的方案。他还在discussion里透露这套微调数据其实只有约1万条examples。他强调数据量没有大家想象得那么重要真正关键的是质量、筛选和验证。这套模型之所以能在抱抱脸上有这么高的热度还有一个很现实的原因本地能跑。这两个模型都是GGUF量化版。GGUF是llama.cpp生态里常见的本地模型格式用户可以用llama.cpp、Ollama、LM Studio、Jan等工具直接加载。这对coding场景尤其有吸引力。毕竟写代码、看仓库、跑命令、调bug经常涉及私有项目和本地环境。能在自己机器上跑就意味着不用把代码传到云端也不用每次都付API调用成本。更关键的是它门槛不算高。V1模型卡里写到最小的Q2_K版本约4.5GB只要有约4.5GB显存或统一内存就能跑一个私有、离线的编程助手。作者推荐的甜点位是Q4_K_M大小约6.87GB更高质量的Q8_0则约11.8GB。V2因为更偏agentic作者没有放Q2_K。理由是压力测试没过不够可靠。所以V2的最小可靠版本从Q3_K_M开始约5.7GB推荐的Q4_K_M依然是约6.87GB。作者还提前剧透了后续计划——V3已经在路上。他表示V3仍然会沿着12B这条线继续做codingagentic方向。作者说自己也没想到这次后训练的提升会这么大所以接下来会继续往前推。尤其是在tau2-bench telecom上V2还有一些“过度尝试、反复retry”的问题V3会继续通过更多训练来改。另一方面他还在做一个更大的版本Qwen3.6-27B。相当于把同一套codingagentic配方放到更大的底座上给显存更宽裕的用户用。一个人40小时杀进大厂中间能单枪匹马冲上抱抱脸热榜下载量加起来超70万在一众大厂机构间杀出一席之地。这位作者究竟是何方神圣量子位与作者取得联系后也得知了他的故事。他叫逯雨鑫目前是美国一所高校在读的AI方向研究生本科念的是数据与商业分析中间还专门去补过一轮全栈开发把前后端、软件开发、数据处理都学了。这两个爆火模型并不是他的主业而是纯自费的个人项目。“开源这东西其实只是花钱并不会让你有任何收入。”他很清楚这一点因此他做V1的最初动机反而是“自我提升”学校教的知识更新太慢他读研时教授讲的还是两三年前的内容而AI日新月异他干脆拿这个项目来逼自己追上最新的东西。为了做这些模型他烧掉了整整一个Claude Max 20×套餐单是V2就花了40多个小时。一条条合成数据、手动清洗、训练、评测、再训练几乎全是一个人扛下来的。硬件上他用的是一张RTX 5090显存为32GB VRAM另外还有约96GB的本地SSD资源可配合使用。实际能调动的资源规模大约在128GB左右。对个人开发者来说不算差但跟大厂和AI Lab的算力池完全不是一个量级。他告诉量子位整个过程里最耗时的其实不是训练而是数据处理。尤其是agentic数据真实对话往往很长一个任务可能有十几步几千甚至几万个token。但受限于显存他训练时一次最多只能喂2048 token。所以他做了类似“滑动窗口”的处理在每段多轮会话里以最近一次用户消息为锚点围绕一次工具调用把上下文裁到预算以内。V1和V2都以Gemma 4-12B为底座。选它不是因为好做恰恰相反Gemma 4的格式和工具协议都比较特殊适配起来很麻烦甚至很多客户端支持并不完善。逯雨鑫表示一方面是挑战自己另一方面是因为12B这个尺寸很有吸引力。他算过如果量化到3bit左右很多8GB统一内存的Mac用户也能跑起来还能留出一定上下文窗口。我现在知道很多人使用的电脑还是8GB左右的统一内存。所以我想在最大可能的参数量下让更多人使用到。逯雨鑫把本地模型的价值总结成两个词隐私免费。他觉得很多人只是想让AI帮自己整理文件、处理数据、做PPT或者体验一下agent并不一定愿意每个月为Claude、GPT付费。人可能就是想玩一玩为什么非得要收费呢V1发布后他一开始没太关注榜单只是像往常一样在模型卡里说如果大家喜欢、下载量和likes多他就继续做V2。没想到两三天后模型突然从不知道多少名跳到第八睡了一觉又冲到第一。随后评论和issue大量涌进来。他几乎每条都看。最多的时候每天花三四个小时看Hugging Face评论、回复问题、测试用户反馈再把结果告诉对方。他表示“社区有需求我是真的在去做这才是最关键的。”原来还是个爱看网文的…在HF上逯雨鑫总共发布了9个公开模型除了两个爆火模型他还做过“直接蒸Claude”的模型。比如gemma-4-12B-it-Claude-4.6-4.8-Opus-GGUF可以理解成通用版Gemma4-12B蒸馏模型。它不只限定编程更像是在把Claude Opus的回答风格、推理习惯、thinking能力往这个12B本地模型里压。另一个模型则干脆换上JetBrains的编程模型Mellum2当底座专做推理蒸馏。再继续往下看…等等怎么还有网文的微调模型啊好家伙还分了四个题材都是中文网文LoRA而且全都基于Qwen3.6。逯雨鑫告诉量子位这其实是他最早开始做Hugging Face模型的入口。因为他自己本来就喜欢看小说。追一本没完结的小说时读者焦虑作者日更码字也很辛苦。于是他想做一整套免费的小说生成pipeline用不同风格的中文小说LoRA让作者能用AI提速读者也能更快看到内容。但中文小说LoRA在HF上并不算热门后来他发现用户更关注coding和agentic于是方向慢慢转到了现在这条线上。当问及他对其他个人开发者有什么建议时逯雨鑫说真诚和坚持最重要。真诚是不要夸大模型能力。哪里强哪里弱都说清楚。你要如实告诉大家。我骗你说我这有多强但真实使用下来出现很多问题下次我一发东西你就不相信我了。坚持则是开源作者必须接受这件事你一定会遇到不好的声音。模型火了以后逯雨鑫也遇到过质疑但他还是决定坚持下去。在他看来开源这条路本来就很难。就算登顶Hugging Face热榜也不会直接带来收入。更多时候是自己花钱买算力、花时间处理数据、回复评论、修bug然后还要面对少数负面声音。而支撑他一路做下来的还有一种很个人的工作节奏。逯雨鑫提到自己患有ADHD。过去这可能意味着很难长期按部就班推进一件事但在AI这个变化极快的领域快速切换兴趣、迅速进入hyperfocus反而成了某种优势。他甚至认为“AI时代是ADHD的天下。”因为一个方向凉下来后如果还一直钻在里面等再转去学新的东西可能已经晚了。聊到最后我们也抛出了那个最初的问题作为个人开发者凭什么能在大厂中间挤进前排逯雨鑫的回答很中肯。他认为大厂当然能做得更好有更多researcher也有更强算力。但大厂发布开源小模型往往还承担品牌宣传、API引流等目标而个人开发者没有这些包袱反而可以更专注地解决一个具体痛点。原文链接抱抱脸模型TOP榜我现在只服yuxinlu1-36氪