自学内容网 > 正文

YOLOv6网络结构学习

🕗 发布于 2024-07-19 09:54 YOLO 学习

《YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications》

学习yolov6之前，可以先了解一下RepVGG

轻量级网络论文-RepVGG 详解

推理是基于已训练好的模型或知识库，对新的或未知数据进行预测、分类或决策的过程。它的目的是应用已学到的知识和能力来解决实际问题。相比之下，训练是通过给定的数据集和算法调整模型参数，使模型能够从数据中学习并捕获有用的特征和规律。训练的目的是使模型在特定任务上达到较高的性能。

主要的参考文献：

目标检测——YOLOv6算法解读

1.Backbone

与其他主流架构相比，作者发现RepVGG骨干网络具备和小型网络一样的推理速度，但是提取到的特征更丰富，性价比很高，但是由于参数和计算成本的爆炸性增长，它很难被缩放以获得更大的模型。所以作者把RepBlock作为小型网络的子模块；对于大型模型，作者基于现在的CSP模块进行改进得到了CSPStackRep模块。将Yolov5的CSP中的BottleNeck中的CBS换成RepConv+Relu。如下图所示为RepBlock和CSPStackRep的结构图：

作者将Backbone中stride=2的普通Conv层替换成了stride=2的RepConv层。同时，将原始的CSP-Block都重新设计为RepBlock，其中RepBlock的第一个RepConv会做channel维度的变换和对齐。另外，作者还将原始的SPPF优化设计为更加高效的 SimSPPF。

2.Neck

YOLOv6也和v4/v5一样采用了PAN结构，不同的是，作者用RepBlocks(N/S)或CSPStackRep(M/L)对CSPBlock进行了替换，同时对整体 Neck 中的算子进行了调整，目的是在硬件上达到高效推理的同时，保持较好的多尺度特征融合能力，命名为Rep-PAN，结构如下图所示：

3.Head

像FCOS和YOLOX一样，也是解耦了分类和回归任务，但它们都在每个分支中引入额外的两个3x3卷积层用于提取任务特征；在YOLOv6中，作者采用混合通道策略，将3x3卷积层简化到只使用一个，检测头的宽度由骨干和颈部的宽度乘数共同缩放。这些修改进一步降低了计算成本，以实现更低的推理延迟。使其更加高效，命名为Efficient Decoupled Head。
但这一部分其实不太理解

主要对BackBone和Neck结构的改进进行学习，其他改进的方法先不学啦

原文地址：https://blog.csdn.net/Linxiaojiejieya/article/details/140389074

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：你需要掌握的前端开发的高级功能---虚拟列表
下一篇：【02】LLaMA-Factory微调大模型——LLaMA-Factory搭建

前端模拟面试：7个JavaScript数组进阶面试题
你坐在面试室里，对面的面试官微笑着，轻敲着桌面问道：“那我们来聊聊 JavaScript 吧。数组操作你有多熟悉？”你意识到，眼前这个问题看似简单，但面试官可能在考察你对 JavaScript 基础知
阅读更多2024-11-13
Kafka 快速入门（一）
kafka详细的安装、集群部署及关于生产者和消费者的命令
阅读更多2024-11-13
Python模拟A卷选择题
Python模拟A卷选择题
阅读更多2024-11-13
科研绘图系列：R语言差异分析双侧柱状图（grouped barplot）
科研绘图系列：R语言差异分析双侧柱状图（grouped barplot）
阅读更多2024-11-13
消息中间件类型介绍
• 常见的实现有Kafka、RabbitMQ（在特定配置下）、Redis的Pub/Sub功能等。• 流处理平台不仅提供了消息传递的功能，还提供了对流数据进行实时处理和分析的能力。• 消息队列是一种通用
阅读更多2024-11-13
初始化mysql5.7
初始化mysql5.7
阅读更多2024-11-13
Knife4j调试全局对象参数自动化
Knife4j是为Java MVC框架集成Swagger生成Api文档的增强解决方案，其中具备了在线调试功能，但是在许多场景当中需要在请求头或者请求体当中携带认证信息，这样就会增加调试的繁琐性。所以针
阅读更多2024-11-13
Python、selenium 自动化 - 实现自动上传外部文件
selenium上传文件
阅读更多2024-11-13
深入探索AutoDL平台：深度学习GPU算力最佳选择
在深度学习领域，计算资源是推动研究和开发的重要因素之一。幸运的是，AutoDL作为一款专业的GPU租用平台，正在改变我们获取计算资源的方式。今天，我将为大家详细讲解如何高效利用AutoDL，以及一些实
阅读更多2024-11-13
STM32WB55RG开发(3)----生成 BLE 程序连接手机APP
本项目旨在利用 STM32WB55 微控制器的蓝牙低功耗（BLE）功能，实现与手机 APP 的无线连接。通过配置时钟源、启动关键模块（如 RCC、RTC、RF、IPCC 和 HSEM），以及启用蓝牙功
阅读更多2024-11-13