YOLOv8改进线性注意力模块 ICCV2023 FLatten Transformer

🕗 发布于 2024-10-06 08:52 YOLO

1，原理部分

在将 Transformer 模型应用于视觉任务时，自我注意的二次计算复杂性一直是一个持续的挑战。另一方面，线性注意力通过精心设计的映射函数近似 Softmax 操作，通过其线性复杂性提供了一种更有效的替代方案。然而，当前的线性注意力方法要么性能显著下降，要么从 Map 函数中引入额外的计算开销。在本文中，我们提出了一种新的 Focused Linear Attention 模块，以实现高效率和表现力。具体来说，我们首先从两个角度分析了导致线性注意力性能下降的因素：聚焦能力和特征多样性。为了克服这些限制，我们引入了一种简单而有效的映射函数和一种高效的秩恢复模型，以增强自我注意力的表现力，同时保持较低的计算复杂度。大量的实验表明，我们的线性注意力模块适用于各种先进的视觉 Transformers，并在多个基准测试中实现了持续改进的性能。

原文地址：https://blog.csdn.net/qq_53545309/article/details/142716424

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：查缺补漏----IP通信过程
下一篇：大学生就业招聘：Spring Boot系统的架构分析

随记前端框架React的初步认识
ant design proComponents 也是一个组件库，是一个高级组件库，就是把一些ant design的基本组件集合在一起，这样可以减少我们写的代码，但是封装的越多的话，灵活度肯定没有自己
阅读更多2024-10-06
C++ | Leetcode C++题解之第458题可怜的小猪
C++ | Leetcode C++题解之第458题可怜的小猪
阅读更多2024-10-06
yolov11 部署瑞芯微rk3588、RKNN部署工程难度小、模型推理速度快
yolov8还没玩溜，yolov11又来了，那么部署也又来了。完整代码：包括onnx转rknn和测试代码、rknn板端部署C++代码。
阅读更多2024-10-06
普林斯顿数学指南[全三卷] 中文版目录
普林斯顿数学指南[全三卷]（[英] Timothy Gowers 编，齐民友译)
阅读更多2024-10-06
ICM20948 DMP代码详解（64）
ICM20948 DMP代码详解（64）
阅读更多2024-10-06
函数式编程语言介绍
大部分编程语言都是面向过程了,程序就是一系列指令,这些指令告诉计算机如何操作,如:C,Pascal,shell都是过程语言.对于声明式语言, 你要编写一系列规范描述该问题如何解决.SQL就是一种声明式
阅读更多2024-10-06
ROS C++ : 读取RosBag包
ROS C++ : 读取RosBag包1. 读取单个话题 1.1. 核心代码 1.2. 完整示例2. 读取多个话题 2.1. 核心代码 2.2. 完整示例3. 读取全部话题
阅读更多2024-10-06
RAG再总结之如何使大模型更好使用外部数据：四个不同层级及查询-文档对齐策略
本文主要介绍了RAG中查询的四个层次以及关于RAG中的查询-文档对齐的几种策略，这些都是很常用策略。在大模型时代，我们如何有效的去学习大模型？现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持
阅读更多2024-10-06
Unity网络开发记录（五）：二进制传输消息类
前篇所写的CS模型只能传输字符串，在本篇文章中，尝试在服务端一次传输多种类型的数据，并在客户端接收到信息之后进行解析显示为了实现对不同类型的数据传输，需要将不同类型的数据都转换成二进制的形式在网络中进
阅读更多2024-10-06
力扣中等 78.子集
有两种解法，对于计算[1,2]的子集问题：站在输入的角度思考：每个元素都可以选/不选代码如下：解法二：站在答案的角度思考代码如下：参考b站灵茶山艾府
阅读更多2024-10-06

YOLOv8改进线性注意力模块 ICCV2023 FLatten Transformer

1，原理部分

相关文章