pytorch学习（十五）二维卷积和转置卷积

🕗 发布于 2024-07-22 09:12 pytorch 学习 人工智能

卷积爆喊了stride步长，padding是否加边，groups是否完全计算，kernel_size卷积核的大小，等尺寸，不同的尺寸组合，可以让图像在卷积后保持原来的形状，也可以让图像的通道数增加。

话有一个是转置卷积，当kernel_size核stride设置为一致的时候，可以扩大倍数的升采样。

具体参数的意义可以跟着代码来看，其中conv2d在本博客中分析的相对详细，转置卷积的padding没有测试。

具体的代码如下：

import torch
x = torch.randn(3,1,5,4)
print(x)

#卷积核的尺寸是多大呢？1通道变成了4通道，那么卷积核就是[1,2,3]就是1通道2行3列，但是有4个卷积核,，那么就是（4，1，2，3）的尺寸
#如果输入的是彩色图像呢，通道是3，输入4通道，着要怎么卷积呢？ 哈哈，那就是卷积核变成了（3，2，3），并且有4个，那么就是（4，3，2，3）的尺寸
#用print(conv.weight.data.size())来证明

#1 尺寸分析
#卷积核尺寸是(2,3)也就是两行三列，去卷（5，4）5行4列，得到就是4行2列
#输入通道Conv2d(1， 是1对应的是（3，1，5，4）的通道1，也就是数据按照BCHW（batch，channels，height，width）排列的时候的channels值
#也就是说输入的是黑白的图像，而不是彩色的图像
#Conv2d(1,4,(2,3))中的4表示输出通道是4，表示的是输出的channels=4，所以卷积核卷一个(1,5,4)会得到一个（4，4，2）
#B= 3，所以最后得到的尺寸就是（3，4，4，2）
conv = torch.nn.Conv2d(1,4,(2,3))
res = conv(x)
print(res)
print(res.shape)
print(conv.weight.data.size())   #torch.Size([4, 1, 2, 3])

#2.加入padding的尺寸分析
#第一个案例中的5行4列变成了4行2列，就是因为padding没有的结果，如果padding在列方向上是1，则列保持原尺寸
conv = torch.nn.Conv2d(1,4,kernel_size = (2,3),padding=(0,1))
padding_res = conv(x)
print(padding_res)
print(padding_res.shape)

#3.加入stride的尺寸分析
#第一个案例中的5行4列变成了4行2列，stride=2的时候，则列方向只能走一步，走第二步就超界了因此列为1，行可以走2步
#因此形成的单通道尺寸就是【2，1】，加上4个通道就是[4,2,1],加上B就是【3，4，2，1】
conv = torch.nn.Conv2d(1,4,kernel_size = (2,3),stride=2)
stride_res = conv(x)
print(stride_res)
print(stride_res.shape)


#4.dilation空洞卷积，可以增加感受野, 在行方向上dilation是2则表示卷积核变成了（3，3），应用于（5，4）上，则变成了（3，2）
conv = torch.nn.Conv2d(1,4,kernel_size = (2,3),stride=1,dilation=(2,1))
dilation_res = conv(x)
print(dilation_res)
print(dilation_res.shape)


#bias 为1行4列 ,可以看到只是卷积之后加的一个数值
print(conv.bias.data)  #tensor([-1.7308e-01, -1.6001e-04, -2.6300e-01,  2.8908e-01])

#groups为控制卷积的形状,当groups=2的时候，其中一个6/2 = 3有一个卷积核来卷它，因此卷积核减倍,就是weights就是[4,3,2,3]
x = torch.randn(3,6,5,4)
conv = torch.nn.Conv2d(6,4,kernel_size = (2,3),stride=1,dilation=(2,1),groups=2)
dilation_res = conv(x)
print(dilation_res.shape)
print(conv.weight.data.size())

#转置卷积，上采样的时候会用到 kernel_size=2,stride=2刚好图像扩大一倍,
#详细的看参考 https://blog.csdn.net/m0_49963403/article/details/138535839
x = torch.randn(3,6,5,4)
conv = torch.nn.ConvTranspose2d(6,6,kernel_size=2,stride=2)
x_ConvTranspose2d = conv(x)
print("x_ConvTranspose2d:\n",x_ConvTranspose2d.shape)
print(conv.weight.data.size())

原文地址：https://blog.csdn.net/hero_heart/article/details/140592687

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Springcloud之gateway的使用详解
下一篇：WyTest自动化测试教程

学生公寓管理系统
由于某些特殊原因，需要对学生当前入住的床位进行修改时，使用此功能。新生开学后，宿管管理可以先根据学生所在系查询该专业预定的宿舍和具体的床位入住状态信息，为该学生分配一个空闲状态的床位，并修改当前床位状
阅读更多2024-11-15
Windows上安装RabbitMQ 4.0.3教程
通过上述步骤，你应该已经成功在Windows上安装了RabbitMQ 4.0.3，并启用了管理插件。现在，你可以开始使用RabbitMQ来构建你的分布式系统了。希望这篇教程对你有所帮助，如果有任何问题
阅读更多2024-11-15
【蓝桥等考C++真题】蓝桥杯等级考试C++组第13级L13真题原题(含答案)-成绩排序
C++L13 成绩排序(50 分)
阅读更多2024-11-15
Web入门
HTTP（HyperText Transfer Protocol，超文本传输协议）是一种应用层协议。主要用于在Web浏览器和服务器之间传输数据。基于TCP协议：面向连接，确保了数据传输的可靠性和顺序。
阅读更多2024-11-15
Android 最新的AndroidStudio引入依赖失败如何解决？如:Failed to resolve:xxxx
在引入依赖时报错：Failed to resolve: xxx.xxxx:1.1.0。
阅读更多2024-11-15
力扣113：路径总和II
力扣113：路径总和II。C语言
阅读更多2024-11-15
【springboot使用sqlite数据库】Java后台同时使用mysql、sqlite
根据业务的需要，老版程序使用的数据库是sqlite，版本升级成前后台分离模式，因此需要兼容mysql与sqlite数据库同时使用。
阅读更多2024-11-15
力扣.15 三数之和 three-sum
这道题作为 leetcode 的第 15 道题，看起来似曾相识。大概思路可以有下面几种：暴力解法数组排序+二分Hash 优化双指针。
阅读更多2024-11-15
力扣第 53 题：最大子数组和
题目给定一个整数数组nums，目标是找到和最大的连续子数组（最少包含一个元素），并返回其和。例如，在数组中，和最大的子数组为，其和为6。
阅读更多2024-11-15
linux-缓冲区
调用系统调用接口是需要时间成本的，如果使用缓冲区，存储的字符串到一定长度再调用系统调用，能够有效减少调用系统调用的次数。这个缓冲区是语言设置的，缓冲区满足条件就用系统调用接口write将缓冲区的内容刷
阅读更多2024-11-15

pytorch学习（十五）二维卷积和转置卷积

相关文章