【PyTorch】（基础四）---- 图像处理

🕗 发布于 2024-12-09 13:28 pytorch 图像处理 人工智能 数据分析数据挖掘

图像处理

关于计算机图像处理都在torchvision库中，其中transforms 模块提供了丰富的图像预处理功能，用于数据增强和标准化等操作。比如我们之前使用的ToTensor类就来自这个模块，接下来介绍一些如何使用这个类完成其它的图像处理功能。

基本变换：
- ToTensor()：将 PIL 图像或 NumPy 数组转换为 PyTorch 张量，并将像素值归一化到 [0, 1] 范围。
- Normalize(mean, std)：对张量进行标准化，减去均值并除以标准差。
- Resize(size)：调整图像大小。
- CenterCrop(size)：从中心裁剪图像。
- RandomCrop(size)：随机裁剪图像。
- RandomHorizontalFlip(p)：以给定的概率水平翻转图像。
- RandomVerticalFlip(p)：以给定的概率垂直翻转图像。
- ColorJitter(brightness=0, contrast=0, saturation=0, hue=0)：随机改变图像的亮度、对比度、饱和度和色调。
组合变换：
- Compose(transforms)：将多个变换组合在一起，按顺序应用。

Normalize

Normalize用于将一个tensor类型的图像进行规范化处理，其主要参数为mean(均值)和std(方差)，使用``input[channel] - mean[channel]) / std[channel]` 公式进行处理。

图片的Normalize处理主要应用于深度学习、机器学习和计算机视觉任务的预处理阶段，它的目的是为了使得数据具有更好的数值属性，实现加速训练过程和减少过拟合的目的，提高模型训练的效率和效果。

from PIL import Image
import torchvision
from torch.utils.tensorboard import SummaryWriter
# 归一化
# Image读取图片
img = Image.open("test.jpg")

# 转换成tensor格式
myToTensor = torchvision.transforms.ToTensor()
img_tensor = myToTensor(img)

# 归一化，使用方法和ToTensor类似，先创建对象
myNormalize = torchvision.transforms.Normalize([0.5,0.5,0.5],[1,1,1])
img_norm = myNormalize(img_tensor)

# tensorboard可视化
writter = SummaryWriter('logs/log2')
writter.add_image('img_norm',img_norm)
writter.close()

运行结果：

在这里插入图片描述

Resize

在transform中，用resize实现调整图像大小的功能，resize的参数可以有两种表示方法，如果传入了两个数字，则宽高分别变为指定的大小；如果只传入一个数字，则使用最小边匹配，另一条变进行等比缩放

# resize缩放图像
# 使用Image读取PIL类型的图像
img_PIL = Image.open('test.jpg')

# 使用ToTensor将PIL转为tensor类型
myTotensor = torchvision.transforms.ToTensor()
img_tensor = myTotensor(img_PIL)

# 将tensor图片进行resize
myResize = torchvision.transforms.Resize((2000, 1500))
img_resize = myResize(img_tensor)

# 只传一个参数
myResize2 = torchvision.transforms.Resize((1000))
img_resize2 = myResize2(img_tensor)

# 可视化
writter = SummaryWriter("logs/log3")
writter.add_image('原图：', img_tensor)
writter.add_image('两个参数变形后：', img_resize)
writter.add_image('一个参数变形后：', img_resize2)
writter.close()

RandomCrop

实现随机裁剪，用于数据增强

writter = SummaryWriter("logs/log4")

# 使用Image读取PIL类型的图像
img_PIL = Image.open('test.jpg')

# 使用ToTensor将PIL转为tensor类型
myTotensor = torchvision.transforms.ToTensor()
img_tensor = myTotensor(img_PIL)

# 随机裁剪
my_randomcrop = torchvision.transforms.RandomCrop((1000,2000))
for i in range(10):
    img_randomcrop = my_randomcrop(img_tensor)
    # 指定迭代步数
    writter.add_image('random:',img_randomcrop,global_step=i)
writter.close()

通过拖动上面的进度条就可以看出每一次迭代产生的结果

在这里插入图片描述

Compose

Compose用于将多个变换组合在一起，按顺序应用。

# 组合多个方法
my_compose = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor(),
    torchvision.transforms.Normalize([0.5,0.5,0.5], [1,1,1]),
    torchvision.transforms.RandomCrop((1000,2000))
])

img_com = my_compose(img_PIL)
writter = SummaryWriter("logs/log5")
writter.add_image('组合变形:', img_com)
writter.close()

在这里插入图片描述

原文地址：https://blog.csdn.net/dao_cao_renshuai/article/details/144271602

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：sqlmap --os-shell的原理（MySQL,MSSQL,PostgreSQL,Oracle,SQLite）
下一篇：【Canvas与图标】乡土风金属铝边立方红黄底黑字图像处理图标

windows C#-对象和集合初始值设定项(中)
使用 C# 可以在单条语句中实例化对象或集合并执行成员分配。
阅读更多2024-12-27
华为OD E卷（100分）38-数组拼接
工作了十几年，从普通的研发工程师一路成长为研发经理、研发总监。临近40岁，本想辞职后换一个相对稳定的工作环境一直干到老, 没想到离职后三个多月了还没找到工作，愁肠百结。为了让自己有点事情做，也算提高一
阅读更多2024-12-27
Ajax中的axios
Asynchronous JavaScript And XML：异步的JavaScript和XML。使用XML HttpRequest 对象与服务器进行通讯。AJAX 是一种在无需重新加载整个网页的情
阅读更多2024-12-27
tomcat temp临时文件不清空，占用硬盘，jdk字体内存泄漏
JSP老旧项目迁移过来的代码，生成海报，会读取图片，读取字体文件，绘制图片，会生成大量临时文件。
阅读更多2024-12-27
Java课程设计：基于tomcat+jsp+sqlserver的javaweb计算机配件报价系统
前台功能模块：系统首页、我的信息、留言板、用户登陆、公告以及日历模块后台功能模块：修改个人信息、管理员管理、注册用户管理、类别信息管理、类别信息添加、散件信息管理、散件信息添加、公告信息管理、公告信息
阅读更多2024-12-27
8.zynq编译应用程序
## MPsoc开发应用的三种方法- 方法一：使用petalinux工具- 方法二：使用vitis工具- 方法三：***使用SDK工具***
阅读更多2024-12-27
在 RK3568 Linux 系统上使用 TUN 设备：详细教程
是 Linux 内核中提供的虚拟网络设备。它们用于实现用户空间程序与内核网络栈的交互。
阅读更多2024-12-27
【数据分析】贝叶斯定理
贝叶斯定理。
阅读更多2024-12-27
Matrix-Breakout 2 Morpheus
这个工具扫出来了好几个目录和文件，我们访问一下graffiti.txt，graffiti.php 这两个文件。发现我们输入的数据是 123456 生成的文件为 graffiti.txt。发现 1234
阅读更多2024-12-27
如何选择最佳时间进行WordPress网站维护避免流量损失
找到流量最低的时间段：使用Google Analytics或MonsterInsights的流量报告功能，您可以筛选出网站访问量最低的时间段，例如深夜或周末，然后安排在这些时间进行网站维护。如何通过H
阅读更多2024-12-27

【PyTorch】（基础四）---- 图像处理

图像处理

Normalize

Resize

RandomCrop

Compose

相关文章