119、感受野增强模块 RFB 在 Neck 中的应用:多分支空洞卷积的上下文感知

发布时间:2026/7/5 5:45:11
119、感受野增强模块 RFB 在 Neck 中的应用:多分支空洞卷积的上下文感知 119、感受野增强模块 RFB 在 Neck 中的应用:多分支空洞卷积的上下文感知一、从一次尴尬的漏检说起去年秋天帮某自动驾驶公司调一个夜间行人检测模型,baseline 是当时刚出的 YOLOv8x。白天指标漂亮得很,mAP 0.85 往上走。一到夜间场景,小尺寸行人直接崩到 0.32。我盯着 TensorBoard 里的特征图看了三天,发现 Neck 输出的特征图在低光照区域几乎全是噪声,感受野根本覆盖不到远处稀疏的像素点。当时试了 ASPP、SPPFCSPC,效果有提升但不够。直到我把 RFB(Receptive Field Block)塞进 Neck 的 C2f 模块后面,夜间行人 mAP 直接跳到 0.61。这个模块最早是 Receptive Field Block Net 里提出的,核心思想是用多分支空洞卷积模拟人类视觉皮层中不同尺寸的感受野。今天就把这个改进方案完整拆开讲。二、RFB 模块的 PyTorch 实现(踩坑版)先上代码。这个模块我重构过三次,第一次照搬原论文结构,发现训练时显存直接炸了——原版 RFB 用了 5x5 卷积加空洞率 3,在 640x640 输入下中间特征图尺寸太大。后来改成 3x3 堆叠,效果没降,显存省了 40%。importtorch