YOLOv10改进，YOLOv10主干网络替换为VanillaNet( CVPR 2023 华为提出的全新轻量化架构)，大幅度涨点

🕗 发布于 2024-09-24 22:33 YOLO 计算机视觉目标检测 python 人工智能

在这里插入图片描述

摘要

基础模型的核心理念是“更多即不同”，这一理念在计算机视觉和自然语言处理领域取得了惊人的成功。然而，变压器模型的优化挑战和固有复杂性呼唤一种向简化转变的范式。在本研究中，引入了 VanillaNet，一种拥抱设计优雅的神经网络架构。通过避免高深度、快捷方式和复杂操作如自注意，VanillaNet 设计简洁而功能强大。每一层都精心设计为紧凑和简洁，训练后修剪非线性激活函数以恢复原始架构。VanillaNet 克服了固有的复杂性挑战，非常适合资源受限的环境。其易于理解和高度简化的架构为高效部署开辟了新可能。广泛的实验表明，VanillaNet 在性能上与著名的深度神经网络和视觉变压器相当，展示了极简主义在深度学习中的力量。VanillaNet 的这一愿景之旅具有重新定义基础模型格局和挑战现状的巨大潜力，为优雅和高效的模型设计开辟了新路径。

模型细节：

VanillaNet-6 模型的架构，仅由 6 个卷积层组成，非常容易在任何现代硬件上使用。输入特征的大小在每个阶段都被下采样，而通道数则加倍，这借鉴了经典神经网络如 AlexNet 和 VGGNet 的设计。结构如下图所示：
在这里插入图片描述

该结构通过避免深度、高度复杂的操作（如自注意力机制）和快捷连接，实现了设计上的简洁优雅。以下是 VanillaNet 的不同版本的架构细节：
在这里插入图片描述

stem：初始卷积层，使用 4×4 的卷积核，输出通道数为 512，步幅为 4。
stage1：第一阶段，特征图大小为 56×56，包括一个 1×1 的卷积层，输出通道数为 1024，之后接一个 2×2 的最大池化层。
stage2：第二阶段，特征图大小为 28×28，包括一个 1×1 的卷积层，输出通道数为 2048，之后接一个 2×2 的最大池化层。
stage3：第三阶段，特征图大小为 14×14，包括一个或多个 1×1 的卷积层，输出通道数为 4096，之后接一个 2×2 的最大池化层。层数根据不同版本的 VanillaNet 变化（如 VanillaNet-7 有 1 层，VanillaNet-8 有 2 层，以此类推）。
stage4：第四阶段，特征图大小为 7×7，包括一个 1×1 的卷积层，输出通道数为 4096。
classifier：分类器部分，首先是一个 7×7 的平均池化层，然后是一个 1×1 的卷积层，输出通道数为 1000（对应 ImageNet 的 1000 个分类）。
上表中列出了不同版本的 VanillaNet 的详细架构。对于 VanillaNet-13-1.5×，所有卷积层的通道数乘以 1.5。对于 VanillaNet-13-1.5×†，在 stage2、stage3 和 stage4 采用了自适应池化，特征图大小分别调整为 40×40、20×20 和 10×10。

官网表显示了使用不同网络在ImageNet数据集上的分类结果。列出了参数数量、FLOPs、深度、GPU 延迟和准确性以进行比较。在过去的几十年里，研究人员专注于在 ARM/CPU 上最小化 FLOPs 或延迟&

原文地址：https://blog.csdn.net/weixin_44779079/article/details/142493970

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：vue Echart使用
下一篇：物联网实践教程：微信小程序结合OneNET平台MQTT实现STM32单片机远程智能控制远程上报和接收数据——STM32代码实现篇

Qt获取本机Mac地址、Ip地址
今天给大家分享一个获取本机IP地址和Mac地址的方法，经过多次测试，台式机、笔记本等多个设备，暂时没有发现问题。由于很多时候本地安装了虚拟机、蓝牙、无线网卡或者其他设备等，会有多个Mac地址，所以需要
阅读更多2024-09-25
【JVM】JVM执行流程和内存区域划分
`Java` 不想重新编译，而是期望能够直接执行- 先通过 `javac` 把 `.java` 文件==> `.class` 文件（字节码文件，包含的就是 `Java` 字节码，`Java` 自
阅读更多2024-09-25
PR视频剪辑工具全指南：开启专业剪辑之旅
pr视频剪辑可以说是视频剪辑里的一把好手，就是如果你想在这方面深耕那还是掌握这个工具的使用比较方便。如果你只是刚入门，那也有不少可以快速帮你剪辑出片的工具。这次我介绍几款我用过的视频剪辑工具，助你开启
阅读更多2024-09-25
Mac电脑上最简单安装Python的方式
最简单在 Mac 电脑上安装 Python 解释器的方法
阅读更多2024-09-25
Flask建立的Web网站的can‘t open file C_Program问题的分析
考虑到私有化的大模型都是Python编写为主的。但是，用PyCharm进行调试的时候却出现了问题。所以，只有在Flask的Pycharm的调试模式下要出现异常。但是，调试模式不得不用，因为断点跟踪可以
阅读更多2024-09-25
用Flutter几年了，Flutter每个版本有什么区别？
用Flutter几年了，你知道Flutter每个版本有什么区别吗？不管是学习还是面试我们可能都需要了解这个信息。Flutter 每个版本的用法基本都是一样的，每隔几天或者几周就会更新一个版本，2018
阅读更多2024-09-25
Vue.js与Flask/Django后端配合
通过以上步骤，你可以成功地将Vue.js前端与Flask或Django后端进行组合，实现一个全栈的Web应用。这样可以充分利用前后端各自的优势，构建高效、灵活的Web应用。
阅读更多2024-09-25
学习篇 | Dockerized GitLab 安装使用（简单实操版）
浏览器访问 http://localhost:1080，第一次访问需要等几分钟，在页面上创建 root 账户后正常使用。
阅读更多2024-09-25
基于Python+flask+MySQL+HTML的全国范围水质分析预测系统，可视化用echarts，预测算法随机森林
通过系统功能模块的准确性和可靠性验证，采用功能测试用例编写及测试总结方法。总计设计并实施了8项功能测试用例。所有测试用例的执行均已通过验证。所有核心功能，包括用户认证、信息展示、数据分析及预测模块，均
阅读更多2024-09-25
MyBatis-Mapper 接口与 XML 映射
Mapper 接口是一种直接使用 Java 接口与 SQL 语句进行绑定的方式。Mapper 接口允许我们通过编写接口的方法名，来代替传统的手写 SQL 代码，使得开发更加简洁。MyBatis 会根据
阅读更多2024-09-25

YOLOv10改进，YOLOv10主干网络替换为VanillaNet( CVPR 2023 华为提出的全新轻量化架构)，大幅度涨点

摘要

模型细节：

相关文章