从论文看趋势:YOLO在遥感小目标检测中还能怎么改?
近年来,围绕YOLO算法进行改进的研究持续升温,尤其是在目标检测领域依然是热点之一。这些改进大多聚焦于YOLO的骨干网络、颈部结构以及检测头的设计优化,同时也涵盖了损失函数的调整与特定任务的适配。在遥感图像目标检测任务中,常常面临“小目标”和“密集分布”这两个典型挑战:目标尺寸较小、有效像素有限,容易出现漏检与误检,进而影响整体检测性能。针对这一问题,本文将分享近期几篇专注于的优秀研究成果,分别从
近年来,围绕YOLO算法进行改进的研究持续升温,尤其是在目标检测领域依然是热点之一。这些改进大多聚焦于YOLO的骨干网络、颈部结构以及检测头的设计优化,同时也涵盖了损失函数的调整与特定任务的适配。在遥感图像目标检测任务中,常常面临“小目标”和“密集分布”这两个典型挑战:目标尺寸较小、有效像素有限,容易出现漏检与误检,进而影响整体检测性能。针对这一问题,本文将分享近期几篇专注于遥感图像中小目标检测的优秀研究成果,分别从特征提取、特征融合、注意力机制和损失函数等多个角度展开,为相关领域的研究和应用提供参考与启发。
1
【Scientific reports】《A multi-scale small object detection algorithm SMA-YOLO for UAV remote sensing images》
一种用于无人机遥感图像的多尺度小目标检测算法——SMA-YOLO
论文地址:https://www.nature.com/articles/s41598-025-92344-7
基线模型:YOLOv8
在复杂遥感环境中检测小目标面临诸多挑战,包括局部空间信息提取不足、特征融合方式僵化以及全局特征表达能力有限。此外,提升模型性能还需在提高精度与控制计算复杂度之间取得精妙平衡。为应对上述问题,本文提出了SMA-YOLO算法。
论文创新点:
-
在主干网络中引入了非语义稀疏注意力机制(Non-Semantic Sparse Attention, NSSA),能够高效提取与任务相关的非语义特征,从而增强模型对小目标的敏感性。
-
在模型的颈部结构中,设计了双向多分支辅助特征金字塔网络(Bidirectional Multi-Branch Auxiliary Feature Pyramid Network, BIMA-FPN),融合高层语义信息与低层空间细节,在扩展多尺度感受野的同时提升小目标检测能力。
-
引入通道-空间特征融合自适应检测头(Channel-Space Feature Fusion Adaptive Head, CSFA-Head),充分处理多尺度特征,并自适应解决不同尺度间的一致性问题,进一步提升模型在复杂场景下的鲁棒性。
VisDrone2019数据集上的实验结果表明,SMA-YOLO相较基线模型在mAP上提升了13%,展现出在遥感图像小目标检测任务中的卓越适应性。该研究为该领域的进一步发展提供了有价值的思路与新的方法参考。
2
【TGRS 2024】FFCA-YOLO for Small Object Detection in Remote Sensing Images
FFCA-YOLO:用于遥感图像小目标检测的算法
论文地址:https://ieeexplore.ieee.org/document/10423050
代码地址:https://github.com/yemu1138178251/FFCA-YOLO
基线模型:YOLOv5
遥感图像中的小目标检测任务因特征表达不足和背景干扰等问题而变得尤为艰难。尤其是在算法需部署于设备端进行实时处理的场景下,必须在有限计算资源下对精度与速度进行全面优化。为解决这些问题,本文提出了一种高效检测器——特征增强、融合与上下文感知的YOLO(FFCA-YOLO)。
论文创新点:
通过引入三个创新的轻量级、即插即用模块来增强小目标的特征表示并抑制背景干扰:
-
特征增强模块(FEM):通过多分支卷积结构和空洞卷积扩大感受野,增强小目标的局部特征表示。
-
特征融合模块(FFM):采用改进的BiFPN结构,通过通道重加权策略优化多尺度特征融合,提高小目标的语义表示。
-
空间上下文感知模块(SCAM):利用全局平均池化和全局最大池化引导像素学习通道间的关系,实现跨通道和空间的全局上下文交互。
这三个模块分别增强了网络的局部区域感知能力、多尺度特征融合能力以及跨通道与空间的全局关联能力,同时尽可能避免增加模型复杂度。通过这些设计,增强了小目标的弱特征表达,抑制了易混淆的背景。
本文在两个小目标遥感公开数据集(VEDAI和AI-TOD)以及一个自建数据集(USOD)上验证了FFCA-YOLO的有效性。在mAP50指标下,FFCA-YOLO在三个数据集上分别达到0.748、0.617和0.909,优于多个基准模型及当前先进方法。同时,FFCA-YOLO在不同模拟退化条件下的鲁棒性也得到了验证。此外,为进一步降低计算资源消耗并保证检测效率,本文基于部分卷积(PConv)对FFCA-YOLO的主干网络和颈部结构进行重构,提出了轻量化版本L-FFCA-YOLO。L-FFCA-YOLO在几乎不损失精度的情况下,拥有更快的速度、更小的参数规模和更低的计算功耗。
3
【TAES 2024】LKPF-YOLO: A Small Target Ship Detection Method for Marine Wide-Area Remote Sensing Images
LKPF-YOLO:一种用于海洋广域遥感图像的小目标舰船检测方法
论文地址:https://ieeexplore.ieee.org/document/10711228
基线模型:YOLOv7
基于广域遥感图像的舰船检测在海上船舶监管与搜救等领域具有广泛的应用前景。然而,为了覆盖更大范围的海域,广域遥感卫星往往牺牲空间分辨率和光谱分辨率,这导致图像中舰船目标尺度较小、像素点较少,且纹理细节缺失。为此,本文提出了一种深度学习网络——LKPF-YOLO,用于在广域遥感图像中检测小目标舰船。
论文创新点:
-
构建包含约7600个舰船实例的南海广域遥感数据集。
-
为了更高效地提取小目标与低对比度目标的特征,本文设计了重参数化的大核模块C2Rep,以赋予网络更大的有效感受野和更丰富的梯度流信息。
-
设计了一种基于不均衡学习与先验知识的损失函数——Priori Focal Loss,引导模型更加关注小样本与难样本的训练。
实验结果表明,LKPF-YOLO在广域遥感数据集中实现了准确且稳定的小目标舰船检测,在和指标上分别达到93.6%和50.7%,相较原始模型分别提升了5.5%和12.9%。此外,模型的参数量与计算量分别减少了7%和18.7%,展现出良好的部署潜力。
更多推荐
所有评论(0)