CBAM-2018学习笔记

🕗 发布于 2025-01-21 17:51 学习笔记 pytorch

名称：

Convolutional Block Attention Module (CBAM)

来源：

CBAM: Convolutional Block Attention Module

创新点：

fpg0umoj.4ze.png

贡献：

提出CBAM
验证了其有效性
改善提高了以往模型的性能

代码：

  
import torch  
from torch import nn  
  
  
class ChannelAttention(nn.Module):  
    def __init__(self, in_planes, ratio=16):  
        super(ChannelAttention, self).__init__()  
        self.avg_pool = nn.AdaptiveAvgPool2d(1)  
        self.max_pool = nn.AdaptiveMaxPool2d(1)  
  
        self.fc1 = nn.Conv2d(in_planes, in_planes // ratio, 1, bias=False)  
        self.relu1 = nn.ReLU()  
        self.fc2 = nn.Conv2d(in_planes // ratio, in_planes, 1, bias=False)  
        self.sigmoid = nn.Sigmoid()  
  
    def forward(self, x):  
        avg_out = self.fc2(self.relu1(self.fc1(self.avg_pool(x))))  
        max_out = self.fc2(self.relu1(self.fc1(self.max_pool(x))))  
        out = avg_out + max_out  
        return self.sigmoid(out)  
  
  
class SpatialAttention(nn.Module):  
    def __init__(self, kernel_size=7):  
        super(SpatialAttention, self).__init__()  
  
        assert kernel_size in (3, 7), 'kernel size must be 3 or 7'  
        padding = 3 if kernel_size == 7 else 1  
  
        self.conv1 = nn.Conv2d(2, 1, kernel_size, padding=padding, bias=False)  # 7,3     3,1  
        self.sigmoid = nn.Sigmoid()  
  
    def forward(self, x):  
        avg_out = torch.mean(x, dim=1, keepdim=True)  
        max_out, _ = torch.max(x, dim=1, keepdim=True)  
        x = torch.cat([avg_out, max_out], dim=1)  
        x = self.conv1(x)  
        return self.sigmoid(x)  
  
  
class CBAM(nn.Module):  
    def __init__(self, in_planes, ratio=16, kernel_size=7):  
        super(CBAM, self).__init__()  
        self.ca = ChannelAttention(in_planes, ratio)  
        self.sa = SpatialAttention(kernel_size)  
  
    def forward(self, x):  
        out = x * self.ca(x)  
        result = out * self.sa(out)  
        return result  
  
  
# 输入 N C H W,  输出 N C H Wif __name__ == '__main__':  
    block = CBAM(64)  
    input = torch.rand(3, 64, 32, 32)  
    output = block(input)  
    print(input.size(), output.size())

原文地址：https://blog.csdn.net/qq_52964132/article/details/145265674

免责声明：本站文章内容转载自网络资源，如侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：vue3 跨级传递数据
下一篇：Cursor的composer和chat的区别

高效建站指南：通过Portainer快速搭建自己的在线网站
Portainer是一个开源的Docker轻量级可视化工具，它提供了一个直观的Web界面，让你轻松管理和监控Docker容器、镜像和网络等。之前在文章《LinuxDocker图形化工具Portaine
阅读更多2025-01-21
Kotlin Bytedeco OpenCV 图像图像50 仿射变换图像缩放
在OpenCV中，仿射变换（Affine Transformation）和透视变换（Perspective Transformation）是两种常用的图像几何变换方法。
阅读更多2025-01-21
git常见知识点
比如我们要让本地的一个仓库和GitHub上创建的一个仓库关联可以这样。如此你就能够将你的改动推送到所添加的服务器上去了。1、git的三种工作区域是什么?换成你想要推送的任何分支)2、git常见命令。
阅读更多2025-01-21
AdaBoost（Adaptive Boosting）算法
AdaBoost（Adaptive Boosting，自适应提升）是一种迭代的机器学习算法，它通过组合多个弱分类器来构建一个强分类器。AdaBoost 是最早且最著名的提升方法之一，因其简单性和有效性
阅读更多2025-01-21
【思科】NAT配置
通过NAT进行地址转换，使得内部网络能够与外部网络进行通信。
阅读更多2025-01-21
深度学习python基础(第二节) 分支语句和循环语句
本节主要介绍分支语句和循环语句的基本语法。注意：在python中的作用域以缩进为准。
阅读更多2025-01-21
【STM32G4xx的CAN驱动记录】
当前不论是ST还是国产MCU，基本都要GUI工具进行工程配置，只要理解了相关驱动的原理，简单配置就能够使用了，再也不会被N多寄存器支配的恐惧了，但是针对某些要求高效运行的场合还是需要使用寄存器，可采用
阅读更多2025-01-21
STM32单片机：GPIO模式
在它下面的VSS也同理，为0V，当输入电压小于0V时，电流就会流向二极管，从而起到保护作用。1.开漏输出：可输出引脚电平，开漏输出时P-MOS是关闭的，高电平时N-MOS断开，为高阻态；1.上拉输入：
阅读更多2025-01-21
PyQt 异步任务多线程的几种方案
总结QThread：适合需要自定义线程逻辑的场景。QRunnable + QThreadPool：适合轻量级、高并发任务。concurrent.futures：简单结合信号与槽机制使用线程池。
阅读更多2025-01-21
kafka学习笔记2 —— 筑梦之路
Kafka的KRaft模式是一种新的元数据管理方式，旨在去除对ZooKeeper的依赖，使Kafka成为一个完全自包含的系统。在Kafka的传统模式下，元数据管理依赖于ZooKeeper，这增加了部署
阅读更多2025-01-21

CBAM-2018学习笔记

名称：

来源：

相关工作：

创新点：

贡献：

代码：

相关文章