超平实版Pytorch CNN Conv2d

🕗 发布于 2024-04-21 10:50 pytorch cnn 人工智能

torch.nn.Conv2d

基本参数

in_channels (int)
输入的通道数量。比如一个2D的图片，由R、G、B三个通道的2D数据叠加。

out_channels (int)
输出的通道数量。

kernel_size (int or tuple)
kernel（也就是卷积核，也可以称为filter）的形状

bias (bool, optional)
是否加上一个可学习的bias。 Default: True.

stride (int or tuple)
卷积步长。

注：关于为什么kernel_size和stride可以有int、tuple两种表示方式

如果是int，就是对于高那条边、宽那条边应用一样的值。比如如果你的kernel是int，那就是一个正方形的kernel。
如果是tuple，则第1个值应用在高那条边上，第2个值应用在宽那条边上！

输入输出的形状

输入形状：
     $N, C_{in}, H, W)$
     $N$ 是batch size
     $C_{in}$ 是输出的通道数量
     $H$ 是2D input的高度
     $W$ 是2D input的宽度

输出形状：
$N, C_{out}, H_{out}, W_{out})$

公式

在这里插入图片描述

公式左边：
         $N$ 是batch size
         $C_{out}$ 是输出的通道
        (i, j)是索引

所以这里的 $out(N_i, {C_{out}}_j)$ 指的就是当前batch中第I个数据的第j个通道的情况。
你就理解为，现在开始我们抛开batch不谈，且就看一个通道。

公式右边：
五角星理解为一个操作
$k$ 是在数数，从0数到 $C_{in-1}$ ，也就是循环一遍input中的通道数量而已。

图例

（图片引用自Apply a 2D Convolution Operation in PyTorch）
在这里插入图片描述

对于每一次kernel的移动：完全对应的位置，数字两两相乘，然后每一对的结果相加，最后加上bias。这里不确定为什么kernel画了三个颜色，我觉得可能只是表示下面计算的顺序是从左到右、从上到下写的。
在这里插入图片描述

参考文档

原文地址：https://blog.csdn.net/weixin_41811314/article/details/137865360

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：HarmonyOS开发实战：【亲子拼图游戏】
下一篇：iOS 将字符串分割成单个字符| 字符串转成数组

【每日推荐】使用 Ollama 平台上的 Llama 3.2-vision 模型进行视频目标检测
通过这篇文章和视频演示，您将学会如何使用 Llama 3.2-vision 多模态模型进行视频目标检测，同时掌握如何利用 Python 和 FastAPI 框架快速实现此功能。这项技术不仅能应用于视频
阅读更多2024-11-10
Linux的基本指令（一）
对于目录，该命令列出该目录下的所有子目录与文件。对于文件，将列出文件名以及信息。-a列出目录下的所有文件，包括以 . 开头的隐含文件。-l列出文件的详细信息。
阅读更多2024-11-10
软考中级软件设计师上午考试内容笔记（个人向）Part.2
如题所示
阅读更多2024-11-10
vue3+ts+element-ui实现的可编辑table表格组件插入单行多行组件代码可直接使用
最近需求越来越离谱，加班越来越严重，干活的牛马也越来越卑微。写了一个可编辑表格，并已封装好组件，可直接使用。
阅读更多2024-11-10
Greiner 经典力学（多体系统和哈密顿力学）第十一章学习笔记（Rotation About a Fixed Axis）
这一章主要引入了力偶的概念。一对作用在刚体上方向相反，大小相同的力称为力偶。**力偶 ** 对刚体上任意一点的力矩都是相同的。Dl×F其中l是从−F指向F的，具体可以参考下图。我们需要强调的是，力偶矢
阅读更多2024-11-10
Pytest-Bdd-Playwright 系列教程（7）：使用测试代码生成辅助工具
pytest-bdd的代码生成辅助工具提供了一种轻量级的方式，自动创建测试代码的基本结构，而无需手动编写重复代码；对于每个feature文件，它可以生成相应的步骤定义，并自动匹配 Gherkin 语法
阅读更多2024-11-10
SpringMVC处理请求流程
下面是一个常见的SpringMVC处理请求的流程从上面的流程中可以看出核心对象是DispatcherServlet，下面我们根据上面的流程图来分析源码，不过需要先知道一些前置知识。
阅读更多2024-11-10
Mac的极速文件搜索工具，高效管理文件
在Mac的日常与工作使用中，文件管理算是一个不小的难题，查找文件还是有些麻烦的，今天教大家最高效的Mac文件搜索工具的使用方法，Mac的文件管理效率飞速提升
阅读更多2024-11-10
leetcode25:k个一组链表反转
在实时传感器数据的分析系统中，假设每次采集的数据以链表形式存储，传感器数据的批量反转可以确保数据以指定的分组进行处理。：对于实时数据流管理，如果需要分批处理一定量的数据，类似的链表分组翻转算法可以确保
阅读更多2024-11-10
Unity——鼠标点击信息和当前位置获取
在Unity开发中，有时会需要我们获取一些鼠标的信息用于数据交互或者角色控制。以上就是几种在Unity中获取鼠标点击位置的方法。选择哪种方法取决于你的具体需求。通过这些方法，开发者可以创建更加丰富和互
阅读更多2024-11-10