YOLOv8改进 | 特征融合篇，YOLOv8添加iAFF（多尺度通道注意力模块），并与C2f结构融合，提升小目标检测能力

🕗 发布于 2024-09-22 18:09 YOLO 计算机视觉目标检测 人工智能 python

在这里插入图片描述

摘要

特征融合，即来自不同层或分支的特征的组合，是现代网络架构中无处不在的一部分。虽然它通常通过简单的操作（如求和或拼接）来实现，但这种方式可能并不是最佳选择。在这项工作中，提出了一种统一且通用的方案，即注意力特征融合（Attentional Feature Fusion），适用于大多数常见场景，包括短跳跃连接和长跳跃连接引起的特征融合以及 Inception 层内的特征融合。传统注意力机制往往忽略了不同尺度的特征问题，尤其是当融合特征来自不同尺度的层时。为了更好地融合语义和尺度不一致的特征，提出了一个多尺度通道注意力模块（Multi-Scale Channel Attention Module），通过对通道的多尺度上下文信息进行聚合，能够同时强调全局分布较大的对象以及局部分布较小的对象。通过这种方式，网络能够更好地识别和检测尺度变化较大的对象。总而言之，该模块解决了在不同尺度上给出的特征融合时出现的问题，特征图的初始整合可能成为瓶颈，并且通过增加另一个层次的注意力（称之为迭代注意力特征融合）可以缓解这一问题。iAFF在特征融合方面具有很大的潜力，可以持续产生更好的结果。

iAFF介绍

AFF和iAFF的示意图如下：

在这里插入图片描述

AFF模块：通过关注通道的不同尺度（即多尺度通道注意力），解决不同层次特征融合的语义和尺度不一致问题。图（a）中两个输入特征图（X 和 Y）的信息，经过多尺度通道注意力模块（MS-CAM）后，输出特征图Z。具体流程如下：

输入特征 X 和 Y：分别表示不同层或不同尺度的特征图。它们的尺寸都是 C×H×W （C 是通道数，H 和 W 是特征图的高度和宽度）。
加权乘法：首先对 X 和 Y
进行通道上的加权操作，用不同的权重去强调某些通道的信息。通过加权乘法后，两个特征会分别与权重矩阵进行逐通道的乘法操作。
MS-CAM：经过通道加权后的 X 和 Y
被送入多尺度通道注意力模块（MS-CAM）。这个模块负责捕捉不同尺度的全局和局部信息，确保不同分辨率下的特征都能得到充分的融合。
加法操作：最后，将来自 X 和 Y 的特征经过加权求和后得到输出特征 Z。

iAFF模块：在AFF模块基础上进一步引入另一层注意力，改善特征融合质量。这些模块通过更有效的特征融合方式提升了网络整体性能。流程：

第一次加权和融合：与 AFF 一致，首先对输入特征 X 和 Y 进行加权乘法和融合操作，得到初步的输出特征。
第二次 MS-CAM：初步输出再次进入一个 MS-CAM 模块，进一步增强特征间的语义和空间一致性，捕捉更丰富的上下文信息。
第二次加权和融合：再次对输出进行融合，最终得到更丰富、更精确的输出特征 Z。

原文地址：https://blog.csdn.net/weixin_44779079/article/details/142422765

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Vision Transform—用于大规模图像分类的Transformers架构
下一篇：Python学习过程记录1

828华为云征文｜华为云Flexus X实例Windows Server 2019安装护卫神防火墙——为企业运维安全发挥重要作用！！！
公司最近需要选购一台华为云Windows服务器部署产品应用，但是考虑到Windows的安全性至关重要。护卫神防火墙无疑是守护Windows系统安全的得力助手。华为云以其强大的性能和稳定的服务，为众多企
阅读更多2024-09-25
Java集合（下）
简单总结一下HashMap位运算效率更高：位运算(&)比取余运算(%)更高效。当长度为 2 的幂次方时，等价于。可以更好地保证哈希值的均匀分布：扩容之后，在旧数组元素 hash 值比较均匀的情
阅读更多2024-09-25
Xcode 16 上传AppStore遇到第三方库 bitcode 的问题
Xcode16 bitcode
阅读更多2024-09-25
Systemd服务启动报错: Start operation timed out. (执行systemctl start后卡住) 解决方法
如题
阅读更多2024-09-25
C++系列-模版
通常情况下，我们使用模版可以实现一些与类型无关的代码，但对于一些特殊类型的可能会得到一些错误的结果，需要特殊化处理。我们所能打印的只是int类型的变量，但是我们想要打印其他的类型，我们应该怎么做呢，最
阅读更多2024-09-25
Linux软件安装
源码包安装的方式可以在安装过程中根据自己的需求定制自己所需要的功能。3.扩展网络yum源：yum -y install epel-release #安装epel扩展源。YUM在线安装需要
阅读更多2024-09-25
MySQL高阶1949-坚定地友谊
where (t1.user_id, t2.user_id) in (select * from t)：确保t1和t2中的user_id对在CTEt中存在。and t1.friend_id = t2.
阅读更多2024-09-25
网易云信获评“2024年度数字化未来技术变革大奖”
从数字化到数智化，不仅是银行业务办理效率和安全的提升，更是客户个性化和便捷服务体验的一次跃迁。近期，第五届中国银行数智峰会（CIFS 2024）在北京举行，网易云信凭借在银行数字化领域的卓越实践和创新
阅读更多2024-09-25
海信智能电视的使用心得
因为海信会在开机后自动更新系统的，所以新电视开机后不能让它联网，这样电视就不会自动更新了。在原始出厂的系统中找“U盘助手”，然后把U盘上的apk文件改名，去掉后缀名apk，因为海信的U盘助手故意不显示
阅读更多2024-09-25
计算机视觉算法学习路线
详细的计算机视觉算法学习路线，包括具体的学习资源和步骤。
阅读更多2024-09-25

YOLOv8改进 | 特征融合篇，YOLOv8添加iAFF（多尺度通道注意力模块），并与C2f结构融合，提升小目标检测能力

摘要

iAFF介绍

相关文章