YOLOv8改进，YOLOv8检测头融合RepConv卷积，并添加小目标检测层（四头检测），适合目标检测、分割等

🕗 发布于 2025-01-19 10:03 YOLO 目标检测 人工智能 计算机视觉 深度学习

在这里插入图片描述

摘要

作者提出了一种简单而强大的卷积神经网络架构，其推理阶段采用与 VGG 类似的网络体结构，仅由一堆 3x3 卷积和 ReLU 组成，而训练阶段的模型具有多分支拓扑。这种训练阶段和推理阶段架构的解耦通过结构重参数化技术实现，因此我们将该模型命名为 RepVGG。

在这里插入图片描述

# 理论介绍

RepConv 通过将多个卷积操作合并成一个卷积操作来优化计算的。首先在训练过程中使用多种操作（如多个卷积层、跳跃连接等）来提高模型的表达能力和训练效果，而在推理时，通过重参数化将这些操作转化为单一的卷积层，从而减少计算量和提高速度。

训练阶段：在训练时，使用常规的多分支结构，包含多个卷积层、BN 层以及跳跃连接。这种结构可以使模型在训练过程中具有更高的表达能力，从而提高训练性能。这时，每个卷积层可以通过与不同的卷积核和跳跃连接组合来建模复杂的特征。
推理阶段（重参数化）：在模型训练完成后，通过一种重参数化方法，将训练中多层卷积的操作合并成一个单一的卷积操作。例如，多个卷积层和 BN 层的参数被合并成一个单一的卷积核，从而减少了计算量。在推理阶段，RepConv 会将多个卷积层和 BN 层合并成一个 3×3 卷积层和相应的偏置。通过这种方式，可以避免在推理时需要进行多个卷积操作和大量的内存占用。

下图摘自论文
在这里插入图片描述

理论详解可以参考链接：论文地址
代码可在这个链接找到：代码地址

小目标理论

在YOLOv8 中，输入图像的尺寸为 640x640x3，经过 8 倍、16 倍和 32 倍下采样后分别得到 80x80、40x40 以及 20x20 大小的特征图，网络最终在这三个不同尺度的特征图上进行目标检测。在这三个尺度的特征图中，局部感受野最小的是 8 倍下采样特征图，即如果将该特征图映射到原输入图像，则每个网格对应原图 8x8 的区域。对于分辨率较小的目标而言，8 倍下采样得到的特征图感受野仍然偏大，容易丢失某些小目标的位置和细节信息。为了改善目标漏检现状，对 YOLOv8 的 Head 结构进行优化，在原有的三尺度检测头的基础之上，新增一个针对微小目标检测的检测头，YOLOv8 原有 P3、P4 和 P5 这 3 个输出层，分别用于检测小、中、大目标，增加 P2 检测层后，网络能在4个不同尺度的特征图上做检测，P2 能检测到最小目标分辨率为 4x4。通过增加小尺度检测头的方式&#x

原文地址：https://blog.csdn.net/weixin_44779079/article/details/145234127

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：使用docker部署tomcat服务器和mysql数据库
下一篇：JavaScript--常用事件

【深度学习】傅里叶变换
傅里叶变换在深度学习中扮演着重要角色，尤其是在信号处理、图像处理和自然语言处理等领域。通过将数据转换到频域，深度学习模型可以更好地理解和处理复杂的信号和数据。傅里叶变换不仅加速了计算，还提供了新的视角
阅读更多2025-01-20
读《SQL经典实例》学数据库（系列一）
它大部分是通用的，可适用几乎所有的数据库软件。①数据库是什么：水库存水，数据库用来存各种各样的数据。题外话：删除表中的数据时没有加where条件，会删除表中的所有数据，它与truncate有什么区别？
阅读更多2025-01-20
(选项式)Vue父子组件传值&传递方法及可能出现的问题
在 Vue 中，父子组件可以通过以下方式传递值和方法：父组件通过将数据传递给子组件。子组件：父组件：子传父：通过向父组件传递值子组件通过向父组件发送事件。子组件：父组件：父传子：传递方法父
阅读更多2025-01-20
如何查看特定版本的Spring源码
Spring Boot 不同版本通常对应特定的 Spring Framework 版本，例如 Spring Boot 2.x 一般对应 Spring Framework 5.x。具体到小版本，像 Sp
阅读更多2025-01-20
Yaml格式的用例模板
大小写敏感使用缩进表示层级关系缩进不允许使用tab,只允许空格缩进的空格数不重要,只要相同层级的元素左对齐即可#表示标注python所有数据类型,它都可以进行维护:数字,字符,字典,列表都可以进行维护
阅读更多2025-01-20
SQL Server执行计划的步骤对应于查询优化器执行给定SQL查询的部分和优化策略
在SQL Server中，是 SQL Server 用于执行查询的详细路线图。查询的每个部分对应于执行计划中反映的不同操作。了解这些操作有助于优化查询。要优化查询，目标是尽早减少执行计划中处理的行数，
阅读更多2025-01-20
二十项零信任相关的前沿和趋势性技术-Extranet as a Service
ExtranetaaS改进了公司在其环境中启用外联网的方式。随着企业越来越多地使用公共云和 SaaS 服务，它简化了在现代时代设置和保护外联网运行的能力。
阅读更多2025-01-20
【Java】如何使用jdbc连接并操作MySQL，一文读懂不迷路，小白也能轻松学会
详解JDBC的原理，以及如何使用Java通过JDBC来连接并操作MySQL，最后举例完整代码示例。
阅读更多2025-01-20
解决 Java 错误 Java.Sql.SQLException: No Suitable Driver
本篇文章介绍了 Java 中的错误。
阅读更多2025-01-20
Java毕设项目：基于Springboot新能源车租赁网站系统设计与实现开题报告
一方面，只要有能上网的电脑，系统的管理员在任何地方任何时候都可以管理，工作效率进一步提高从而节省人力、物力，只要会打字即可，不需要很高的学历；国内在新能源车租赁网站管理系统的研发上，积极引入新技术，如
阅读更多2025-01-20

YOLOv8改进，YOLOv8检测头融合RepConv卷积，并添加小目标检测层（四头检测），适合目标检测、分割等

摘要

# 理论介绍

小目标理论

相关文章