123、Neck 改进全景总结:18 种 Neck 改进方案的横向对比与最优组合推荐

发布时间:2026/7/5 19:01:32
123、Neck 改进全景总结:18 种 Neck 改进方案的横向对比与最优组合推荐 123、Neck 改进全景总结:18 种 Neck 改进方案的横向对比与最优组合推荐从一次深夜调试说起上周三凌晨两点,我盯着TensorBoard上那条死活不降的mAP@0.5:0.95曲线,差点把咖啡泼到键盘上。项目是自动驾驶场景下的行人检测,baseline用的YOLOv11m,Neck部分还是经典的C2f+SPPF结构。换了几种数据增强、调了学习率调度器,mAP始终卡在68.3%左右。后来翻出之前实验记录,发现Neck部分改过几次但都没系统对比过——这玩意儿到底该用BiFPN还是PANet?GhostConv能不能塞进Neck?ASFF是不是被吹过头了?那晚我花了6个小时,把过去两年在YOLOv5/v8/v11上折腾过的18种Neck改进方案全部拉出来做了横向消融实验。今天这篇笔记,就是那晚的完整记录。代码都是直接从我的实验仓库里扒出来的,注释里写的“这里踩过坑”“别这样写”都是真实血泪史。为什么Neck是YOLO的“隐形瓶颈”很多人改YOLO上来就动Backbone,换RepVGG、换ConvNeXt,结果发现涨点有限。其实Neck才是多尺度特征融合的咽喉。YOLOv11的Neck默认结构是:Backbone输出三层特征(P3/P4/P5) → SPPF → C2f × N → 上采样/下采样 → 拼接 → 检测头这个结构的问题在于:特征融合路径单一,高层语义信息向下传递时被C2f反