YOLOv8模型改进第十九讲添加倒置残差移动块iRMB（Inverted Residual Mobile Block，）去除图像噪声

🕗 发布于 2024-11-08 23:09 YOLO 模块 YOLOv8 YOLOv8模型改进改进

本文这次分享的是倒置残差移动块iRMB，iRMB（Inverted Residual Mobile Block）的作用主要是在神经网络中实现高效的特征提取，它融合了卷积神经网络（CNN）捕捉局部特征的高效性和 Transformer 动态建模长距离交互的能力，通过采用如窗口 - MHSA 和深度可分离卷积等操作来减少模型参数和计算量，在提升模型性能的同时还具备设计上的灵活性，能够在不同的网络架构中方便地应用。本文将其添加到YOLOv8模型当中，使得YOLOv8模型可以更全面、更准确地提取特征，无论是局部细节特征还是全局语义特征都能有效获取。

1. 倒置残差移动块iRMB介绍

模块结构
- 该模块由三个主要的卷积层和一个注意力机制（Attention Mechanism）组成。
- 模块的输入是一个特征图（Feature Map），输出也是一个特征图。
卷积层
- 第一层：1x1 卷积（1x1 Conv）
  - 这是模块的第一层，对输入的特征图进行 1x1 卷积操作。
  - 该层的输出分为三路，分别用于后续的操作。
- 第二层：3x3 深度可分离卷积（3x3 DW - Conv）
  - 这是模块的第二层，对第一层 1x1 卷积的输出进行 3x3 深度可分离卷积操作。
  - 深度可分离卷积是一种高效的卷积操作，能够减少计算量。
- 第三层：1x1 卷积（1x1 Conv）
  - 这是模块的第三层，对第二层 3x3 深度可分离卷积的输出进行 1x1 卷积操作。
  - 该层的输出通过一个跳跃连接（Skip Connection）与模块的输入相加，形成最终的输出。
注意力机制（Attention Mechanism）
- 在第一层 1x1 卷积的输出中，有一部分被用于生成注意力矩阵（Attn Mat）。
- 这部分输出被分成 Q（Query）、K（Key）和 V（Value）三个部分，用于计算注意力矩阵。
- 注意力矩阵的计算在模块的右侧有详细展示，通过 Q 和 K 的交互生成注意力矩阵，然后与 V 相乘，得到注意力加权后的特征图。
跳跃连接（Skip Connection）
- 在模块的最后，第三层 1x1 卷积的输出通过一个跳跃连接与模块的输入相加，形成最终的输出。
- 跳跃连接有助于缓解梯度消失问题，提高网络的训练效率。

3. 倒置残差块

定义
- 倒置残差块（Inverted Residual Block）是一种在深度学习架构中使用的模块。从图中可以看到，它是整个架构中的一部分。
- 它通常包含一个 1x1 卷积层（1x1 Conv），其扩张率（λ）为 4，并且有一个高效操作（Efficient Operator），图中用红色的 “F” 表示。
工作原理
- 首先，输入的特征图（Feature Map）经过 1x1 卷积层进行通道扩张，将通道数扩大。
- 然后，经过高效操作（Efficient Operator），这个操作可能是一些非线性变换或者其他有助于特征提取的操作。
- 最后，可能还会有一个 1x1 卷积层来调整通道数，使其与输入的通道数匹配（如果有残差连接的话）。
在网络中的作用
- 倒置残差块主要用于提取更丰富的特征。通过先扩张通道数再进行特征提取，可以捕捉到更多的特征信息，相比传统的先压缩通道数的残差块（常规残差块），它在一些轻量级网络中表现出更好的性能。
- 它通常用于构建高效的神经网络架构，特别是在移动设备或者对计算资源有限制的场景下，能够在保证一定性能的同时减少计算量。

3. 接下来，我们将详细介绍如何将FSDA集成到 YOLOv8 模型中。

这是我的GitHub代码：tgf123/YOLOv8_improve (github.com)

这是改进讲解：YOLOv8模型改进第十九讲添加倒置残差移动块iRMB 去除图像噪声_哔哩哔哩_bilibili

3.1 如何添加

1. 首先，在我上传的代码中yolov8_improve中找到FSDA.py代码部分，它包含两个部分一个是FSDA.py的核心代码，一个是yolov8模型的配置文件。

2. 然后我们在ultralytics文件夹下面创建一个新的文件夹，名字叫做change_models, 然后再这个文件夹下面创建iRMB.py文件，然后将iRMB的核心代码放入其中

3. 在 task.py文件中导入iRMB

from ultralytics.change_models.iRMB import C2f_iRMB,iRMB

4. 然后将 FSDA添加到下面当中

第一个改进修改的地方

第二个改进修改的地方

5. 最后将配置文件复制到下面文件夹下

6. 运行代码跑通


from ultralytics.models import NAS, RTDETR, SAM, YOLO, FastSAM, YOLOWorld

if __name__=="__main__":

    # 使用自己的YOLOv8.yamy文件搭建模型并加载预训练权重训练模型
    model = YOLO(r"D:\bilibili\model\YOLOV8_new\ultralytics-main\ultralytics\cfg\models\v8\yolov8_irmb.yaml")\
        .load(r'D:\bilibili\model\YOLOV8_new\ultralytics-main\yolov8n.pt')  # build from YAML and transfer weights

    results = model.train(data=r'D:\bilibili\model\ultralytics-main\ultralytics\cfg\datasets\VOC_my.yaml',
                          epochs=100, imgsz=640, batch=8)

原文地址：https://blog.csdn.net/qq_64693987/article/details/143365357

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Ubuntu学习笔记 - Day2
下一篇：Mac切换输入法也有高超技巧

Web性能优化：从基础到高级
然而，要充分发挥性能优化的潜力，还需要持续监测和逐步优化，确保每一步都符合用户体验的要求。企业级应用通常包含复杂的业务逻辑和大量的数据交互，通过优化 CSS 和 JavaScript，避免阻塞渲染，可
阅读更多2024-11-15
HTML5+CSS前端开发【保姆级教学】＋前端介绍和软件安装
前端开发主要涉及网站和 App，用户能够从 App 屏幕或浏览器上看到东西。能够从 App 屏幕和浏览器上看到的东西都属于前端。文章适合计算机小白，大佬请绕行！
阅读更多2024-11-15
群控系统服务端开发模式-应用开发-前端角色功能开发
群控系统服务端开发模式-应用开发-前端角色功能开发
阅读更多2024-11-15
自定义反序列化过程
需求：student对象中name属性，序列化时将该属性映射为stuname，反序列化时将 Json中的NAME键值对映射到name属性中。
阅读更多2024-11-15
界面控件DevExpress WPF中文教程：TreeList视图及创建分配视图
本文主要介绍DevExpress WPF数据网格组件的TreeList视图及如何创建和分配视图教程，欢迎下载最新版组件体验！
阅读更多2024-11-15
微波无源器件 OMT1 一种用于倍频程接收机前端的十字转门四脊正交模耦合器(24-51GHz)
我们报道了一种用于天文学射电望远镜的毫米波波长接收机的一种十字转门四脊OMT的设计，制造和实测结果。此四脊OMT被直接兼容到一个四脊馈电喇叭来实现可以拓展矩形波导单模带宽的双极化低噪声接收机。使用了2
阅读更多2024-11-15
实战：深入探讨 MySQL 和 SQL Server 全文索引的使用及其弊端
MySQL 中的全文索引自 5.6 版本开始支持InnoDB引擎（在此之前，仅支持MyISAM引擎）。全文索引主要适用于CHARVARCHAR和TEXT类型字段，并提供了的查询方式，可以选择不同的查询
阅读更多2024-11-15
前端 - 使用uniapp+vue搭建前端项目（app端）
前端 - 使用uniapp+vue搭建前端项目（app端）
阅读更多2024-11-15
NFS存储基础操作
NFS 挂载主机在网络断开后卡住通常是由于默认的 NFS 挂载选项导致的。为了避免这种情况，可以使用特定的挂载选项来确保在 NFS 服务器不可用时主机不会卡住。在windows 启用和关闭Window
阅读更多2024-11-15
SpringCloud OpenFeign负载均衡远程调用跨服务调用连接池优化
Spring Cloud OpenFeign 是 Spring Cloud 的一部分，提供了一种声明式的 HTTP 客户端方式来简化服务间的通信。通过 OpenFeign，开发者可以像调用本地方法一样
阅读更多2024-11-15

YOLOv8模型改进 第十九讲 添加倒置残差移动块iRMB（Inverted Residual Mobile Block，） 去除图像噪声

1. 倒置残差移动块iRMB介绍

3. 倒置残差块

3. 接下来，我们将详细介绍如何将FSDA集成到 YOLOv8 模型中。

3.1 如何添加

相关文章

YOLOv8模型改进第十九讲添加倒置残差移动块iRMB（Inverted Residual Mobile Block，）去除图像噪声