2025深度学习发论文&模型涨点之——特征融合

特征融合(Feature Fusion)作为机器学习与模式识别领域的核心研究方向之一,旨在通过多源、多模态或多层次特征的协同整合,提升模型的表征能力和泛化性能。近年来,随着深度学习和大数据技术的快速发展,特征融合方法在计算机视觉、自然语言处理、生物信息学等领域展现出显著优势。传统特征融合技术可分为早期融合(Early Fusion)、中期融合(Intermediate Fusion)和晚期融合(Late Fusion),分别从数据层、特征层和决策层进行信息整合。然而,面对高维异构数据,如何有效克服特征冗余、模态差异和噪声干扰,仍是当前研究的重点挑战。

我整理了一些特征融合【论文+代码】合集,需要的同学公人人人号【AI创新工场】发525自取。

论文精选

论文1:

Semantic-Aligned Matching for Enhanced DETR Convergence and Multi-Scale Feature Fusion

语义对齐匹配加速DETR收敛和多尺度特征融合

方法

语义对齐匹配模块(Semantics Aligner):设计了一个插件模块,将目标查询和编码图像特征投影到相同的特征嵌入空间,使目标查询能够更容易地与具有相似语义的相关区域匹配。

代表性关键点搜索:明确搜索每个目标查询的多个代表性关键点,并利用其特征进行语义对齐匹配,增强了表示能力。

多尺度特征融合:基于语义对齐匹配机制,将不同尺度的特征以粗到细的方式融合,有效表示不同尺度的对象。

Transformer架构改进:移除了Transformer中的Dropout,以提高目标检测的性能。

图片

创新点

加速收敛:通过语义对齐匹配,显著加快了DETR的训练收敛速度。在COCO val 2017数据集上,仅用12个训练周期就达到了44.8% AP,比原始DETR训练500个周期的性能还要好。

提升检测精度:在50个训练周期内,SAM-DETR++达到了49.1% AP,成为基于DETR的检测器中性能最高的方法之一。

多尺度特征融合:通过多尺度特征融合,进一步提高了检测精度,尤其是在小目标检测上,性能提升显著。

兼容性:SAM-DETR++作为一种插件模块,可以轻松集成到现有的DETR收敛解决方案中,与其他方法(如SMCA-DETR和DN-DETR)结合使用时,性能进一步提升。

图片

论文2:

ICAFusion: Iterative Cross-Attention Guided Feature Fusion for Multispectral Object Detection

ICAFusion:用于多光谱目标检测的迭代交叉注意力引导的特征融合

方法

双交叉注意力特征融合:提出了一个双交叉注意力特征融合模块,用于同时从RGB和热成像图像中聚合互补信息。

迭代学习策略:通过迭代交互机制,共享多模态Transformer块之间的参数,减少模型复杂性和计算成本。

空间特征压缩:在特征融合前,通过空间特征压缩模块降低特征图的维度,减少计算复杂度。

多模态特征融合:结合了RGB和热成像图像的特征,提高了目标检测的性能。

图片

创新点

性能提升:在KAIST、FLIR和VEDAI数据集上,ICAFusion方法均取得了优于现有方法的性能。例如,在KAIST数据集上,log-average miss rate降低到7.17%,在FLIR数据集上,mAP50提高到79.2%。

计算效率:通过迭代学习策略,减少了参数数量和GPU内存使用,同时保持了模型性能。与堆叠多个Transformer块的方法相比,ICAFusion在推理速度上更快,FPS达到36.7 Hz。

鲁棒性:即使在一个模态图像缺失或质量较差的情况下,ICAFusion仍能提供满意的检测结果,这得益于其跨模态特征融合能力。

通用性:该方法可以集成到不同的检测框架中,并与不同的骨干网络配合使用,具有广泛的适用性。

图片

论文3:

FusionMamba: Dynamic Feature Enhancement for Multimodal Image Fusion with Mamba

FusionMamba:基于Mamba的多模态图像融合的动态特征增强

方法

动态视觉状态空间模块(DVSS):提出了一个改进的Mamba模型,集成了动态卷积和通道注意力,用于图像融合任务。

动态特征增强模块(DFEM):设计了动态特征增强模块,用于动态纹理增强和差异感知,增强了源图像的细节纹理信息。

跨模态融合Mamba模块(CMFM):设计了跨模态融合Mamba模块,用于探索不同模态之间的相关性,并抑制冗余信息。

多模态图像融合框架:采用Unet多层结构,实现了一个高效且通用的图像融合框架。

图片

创新点

性能提升:在多个多模态图像融合任务(如CT-MRI、PET-MRI、SPECT-MRI、IR-VIS和GFP-PC)中,FusionMamba均取得了最佳性能。例如,在CT-MRI任务中,VIF提高到0.5750,SCD达到1.5888,Q𝐴𝐴?/𝐴?提高到0.6429。

计算效率:与传统的CNN和Transformer方法相比,FusionMamba在运行时间和计算复杂度上具有显著优势,FLOPs仅为16.50G,运行时间为0.13秒。

细节增强:通过动态特征增强模块,FusionMamba能够更好地保留源图像的纹理细节和模态特异性信息,提高了融合图像的质量。

通用性:该方法不仅适用于医学图像融合,还适用于红外和可见光图像融合以及生物医学图像融合,具有广泛的适用性。

图片

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐