2024/9/16 dataloader、tensorboard、transform

🕗 发布于 2024-09-20 20:46 pytorch 人工智能 python

一、pytorch两大法宝元素

假设有一个名为pytorch的包

dir()：用于打开包，看里面的内容

help():用于查看具体的内容的用处

二、python文件，python控制台和jupyter的使用对比

三、pytorch读取数据

pytorch读取数据主要涉及到两个类：

使用Dataset类读取数据

从pytorch包中引入Dataset类，写一个子类对Dataset进行继承，重写其中方法达到目的

一般会设置数据路径问题，需import os

四、Tensorboard的使用

TensorBoard 是 TensorFlow提供的一组可视化工具

安装tensorboard

1.SummaryWriter类的使用

1.1 add_scalar()方法

def add_scalar(
    self,
    tag,  # 图像名
    scalar_value,  # y轴
    global_step=None, #  x轴
    walltime=None,
    new_style=False,
    double_precision=False,
):

运行后，出现logs文件夹：

查看该文件：

在终端输入tensorboard --logdir=logs或者tensorboard --logdir PATH

默认生成文件通过6006端口打开，可指定端口打开：tensorboard --logdir=logs --port=6007

点击链接：

注：有时生成文件多了之后，图像出现在一起可能会出现拟合现象，就将所有事件删除后重新生成

1.2 add_image()方法

def add_image(
    self, tag, img_tensor, global_step=None, walltime=None, dataformats="CHW"
):

tag:标题

img_tensor:图片，此处图片只能是torch.tensor，numpy.array或string 不是这些，要转换成这些

global_step：表明是第几张图片

dataformats：图片的通道，高，宽顺序，默认CHW 可自行指定

五、Transform的使用

通过 from torchvision import transforms 引入transforms模块

torchvision是图像处理库，计算机视觉工具包，transforms 集成了随机翻转、旋转、增强对比度、转化为tensor、转化为图像等功能，用于数据增强。（transforms更多的指的是transforms.py文件，其中包含很多类）。

NumPy是一个功能强大的Python库，主要用于对多维数组执行计算，它极大地简化了向量和矩阵的操作处理。

Tensor，即“张量”。实际上跟numpy数组、向量、矩阵的格式基本一样。但是是专门针对GPU来设计的，可以运行在GPU上来加快计算效率。

在PyTorch中，张量Tensor是最基础的运算单位，与NumPy中的NDArray类似，张量表示的是一个多维矩阵。不同的是，PyTorch中的Tensor可以运行在GPU上，而NumPy的NDArray只能运行在CPU上。由于Tensor能在GPU上运行，因此大大加快了运算速度。

在使用 transforms.ToTensor() 进行图片数据转换过程中会对图像的像素值进行正则化，即一般读取的图片像素值都是8 bit 的二进制，那么它的十进制的范围为 [0, 255]，而正则化会对每个像素值除以255，也就是把像素值正则化成 [0.0, 1.0]的范围

详见https://www.cnblogs.com/yq-ydky/p/17617289.html

1.使用ToTensor类将图片数据转化为Tensor类型

2.为什么要使用tensor这一数据类型

tensor这一数据类型包含了很多在神经网络中需要用到内容，比如后向，梯度

对于搭建神经网络更为方便

3.将PIL数据转化为Tensor，利用Tensorboard进行显示

4.常用的transform类

Resize只改变图像大小，不改变其数据类型

compose对象是各种类对象的合成体，要注意的列表中的对象要具有相关性，前一对象的输出是后一个对象的输入

5.transform与数据集的结合使用

torchvision中可以找到一些常用数据集，常用模型：

torchvision — Torchvision 0.19 documentation

torchvision.datasets中包含许多数据集，可直接设置参数使用命令下载

例子：CIFAR10

CIFAR10 — Torchvision 0.19 documentation

（1)下载数据：

数据集中的每一个数据都是一个由图片和对应的类别标签索引组成的元组

(2)原始图片为PIL类型，添加一些transform操作：

（3）利用tensorboard对图像进行显示

六、dataloader介绍

参考：torch.utils.data — PyTorch 2.4 documentation

使用dataset获取数据集时，返回的数据集中每一个数据都是一个由图片和标签组成的元组

CIFAR10中的图片维度（3，32，32）

dataloader负责按照想要的方式从数据集中得到数据

（1）将batch设置为4，每页4个，分多页

（2）将batch设置为64，每页64个，分多页，epoch表示遍历完一遍数据

注：指定了数据集会读取该数据集所有数据，batch只是将数据分批次

format()的使用：

Python字符串格式化之使用format()方法_python_脚本之家

原文地址：https://blog.csdn.net/m0_58285219/article/details/142302397

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Python编码系列—Python原型模式：深克隆与高效复制的艺术
下一篇：ubuntu 执行定时任务crontab -e 无法输入的问题

解决 Spring Boot 中 `Ambiguous mapping. Cannot map ‘xxxController‘ method` 错误
在使用 Spring Boot 开发 Web 应用时，经常会遇到各种各样的错误。其中一种常见的错误是。本文将详细介绍这个错误的原因及解决方法，帮助开发者快速定位并解决问题。解决错误的关键在于确保每个方
阅读更多2024-11-15
数据分析案例-笔记本电脑价格数据可视化分析
本实验数据集来源于Kaggle，原始数据集共有1303条数据，13个变量，各变量含义如下：0 laptop_ID-数字-产品ID1 Company-字符串-笔记本电脑制造商2 Product-字符串-
阅读更多2024-11-15
Linux 如何查看当前系统版本的详细信息？
系统中基本都存在，所以是一种标准的获取系统信息的方式。命令以标准的方式提供详细的发行版信息。发行版的说明文件一般位于。
阅读更多2024-11-15
初级数据结构——栈
数据结构栈（Stack）是一种线性的数据结构，它只允许在序列的一端（称为栈顶）进行插入和删除操作。这种特性使得栈成为许多算法和问题解决中的有力工具。栈是一种简单而强大的数据结构，它遵循后进先出的原则，
阅读更多2024-11-15
网络安全练习之 ctfshow_web
根据前面得到的qq邮箱中的qq号查询用户，目前电脑版的QQ添加好友好像不能查看详细信息，手机版的可以看到对方所在地为陕西西安。路径是：/editor/attached/file/tmp/html/no
阅读更多2024-11-15
Python 三种方式实现自动化任务
本文介绍了用Python实现机器人过程自动化的三个包，方便读者选择、对比学习。
阅读更多2024-11-15
C++基础：Pimpl设计模式的实现
PIMPL （ Private Implementation 或 Pointer to Implementation ）是通过一个私有的成员指针，将指针所指向的类的内部实现数据进行隐藏。
阅读更多2024-11-15
【flutter】flutter2升级到3.
以这个 https://github.com/aa286211636/Flutter_QQ 为例子，升级下看看。只有登录界面能正常显示，别的页面都是报错。flutter这版本变动，基本不能直接ru
阅读更多2024-11-15
【JAVA毕业设计】基于Vue和SpringBoot的宠物咖啡馆平台
基于Vue.js和SpringBoot的宠物咖啡馆平台是一个综合性的在线服务系统，旨在为宠物爱好者提供一个便捷的宠物护理和社交场所。该平台分为管理后台和用户网页端，以满足不同用户群体的需求。管理后台主
阅读更多2024-11-15
认证鉴权框架SpringSecurity-2--重点组件和过滤器链篇
这4个接口中，每一个都是当认证或者授权过程中发生结果后触发，可以是失败的场景也可以是成功后触发。1个成功后执行，3个为失败后促发执行。
阅读更多2024-11-15