完整的模型训练套路 pytorch

🕗 发布于 2024-10-18 01:02 python 机器学习 人工智能

**前置知识：

1、

（1）.train()：将模型设置为训练模式

（2）.eval()：将模型设置为评估模式

不写也可以（只对特定网络模型有作用，如含有Dropout的）

2、

with torch.no_grad():：主要用于评估和推理，确保不会计算梯度，从而节省内存和加速计算。

3、

.item()的作用：将tensor型转为普通数值型

当你有一个只有一个元素的张量时，可以使用 .item() 来提取这个值。

a=torch.tensor(5)
print(a) #tensor(5)
print((a.item())) #5

4、

如何由分类得分来计算正确率：

outputs=torch.tensor([
    [0.1,0.2],
    [0.3,0.4]
]) #两个样本的二分类得分

preds=outputs.argmax(1) #1是横向对比，0是纵向对比，得到预测的分类：[1,1]

targets=torch.tensor([0,1]) #正确的分类

print(preds==targets) #tensor([False,  True])
print((preds==targets).sum()) #tensor(1)
print((preds==targets).sum().item()/2) #正确率=分类正确的样本数/总样本数，得0.5

**代码：

import torch.optim
import torchvision.datasets
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

from model import * #引入模型类文件

一、准备数据集：

#准备数据集
train_set=torchvision.datasets.CIFAR10(root="../dataset",train=True,transform=torchvision.transforms.ToTensor(),download=True)
test_set=torchvision.datasets.CIFAR10(root="../dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)

train_set_size=len(train_set)
test_set_size=len(test_set)
print(f"训练数据集的长度为：{train_set_size}")
print(f"测试数据集的长度为：{test_set_size}")

train_dataloader=DataLoader(train_set,batch_size=64)
test_dataloader=DataLoader(test_set,batch_size=64)

二、创建网络模型：

模型类的定义单独写在一个文件夹里

import torch
from torch import nn

#搭建神经网络
class Classification_CIFAR10(nn.Module):
    def __init__(self):
        super().__init__()
        self.model=nn.Sequential(
            nn.Conv2d(in_channels=3,out_channels=32,kernel_size=5,stride=1,padding="same"), #stride默认等于1，padding没有设置则是0
            nn.MaxPool2d(kernel_size=2), #stride默认等于kernel_size，padding没有设置则是0
            nn.Conv2d(in_channels=32,out_channels=32,kernel_size=5,stride=1,padding="same"),
            nn.MaxPool2d(2),
            nn.Conv2d(in_channels=32,out_channels=64,kernel_size=5,stride=1,padding="same"),
            nn.MaxPool2d(2),
            nn.Flatten(),
            nn.Linear(in_features=64*4*4,out_features=64),
            nn.Linear(in_features=64,out_features=10)
        )

    def forward(self,x):
        x=self.model(x)
        return x

#测试模型的正确性：设一个input，看output的尺寸是否正确
if __name__ == '__main__':
    model=Classification_CIFAR10()
    input=torch.ones((64,3,32,32))
    output=model(input)
    print(output.shape)
    #[ 0.0308, -0.0105, -0.0186,  0.2409, -0.0044,  0.0182,  0.1824, -0.0557, -0.1188,  0.0300]

#输入：一张3通道的图像（大小为32*32）——>64通道（大小为4*4）——>全连接后linear成64通道——>最后linnear成10通道（即十个类别的得分）
#（1，3，32，32）——>（1，10）同理，（64，3，32，32）——>（64，10）

#创建网络模型
model_classification=Classification_CIFAR10()

三、参数和辅助工具的设置：

（损失函数，优化器；训练、测试的次数记录；tensorboard）

#损失函数
loss_func=nn.CrossEntropyLoss() #optional表示参数是可选的

#优化器
learning_rate=1e-2 #相当于(0.01)
optimizer=torch.optim.SGD(model_classification.parameters(),lr=learning_rate) #随机梯度下降

#设置训练网络的一些参数
total_train_step=0 #记录训练的次数
total_test_step=0 #记录测试的次数
epoch=2 #训练、测试的轮数（一轮有多次，次数=imgs总数/每次处理的图片数）

#添加tensorboard来监控数据的变化
writer=SummaryWriter("E:\DLearning\Learning\logs") #路径问题，换成绝对路径试一试

四、开始训练和测试：

for i in range(epoch):

    print(f"——————————————第{i+1}轮训练开始——————————————")
    #训练步骤开始
    for data in train_dataloader:
        imgs,targets=data
        outputs=model_classification(imgs)
        #计算损失
        loss=loss_func(outputs,targets)
        #优化
        optimizer.zero_grad() #梯度清零
        loss.backward() #计算梯度并反向传播
        optimizer.step() #梯度优化（跳跃式）

        total_train_step=total_train_step+1
        if total_train_step%100==0: #逢百才打印、记录（更节省、更清晰）
            print(f"训练次数：{total_train_step},Loss：{loss.item()}")
            writer.add_scalar("train_loss",loss.item(),total_train_step)


    #每训练完一轮后，用验证集来测试，看看训练的效果如何
    print(f"——————————————第{i + 1}轮测试开始——————————————")
    #测试步骤开始
    total_test_loss=0
    total_accuracy=0
    with torch.no_grad(): #不需要调优了，利用现有模型——>with里面的代码就没有了梯度，能保证不会对它进行调优（即使不调用也会累计梯度，会使进程变慢）
        for data in test_dataloader:
            imgs,targets=data
            outputs=model_classification(imgs)
            #求损失
            loss=loss_func(outputs,targets)
            total_test_loss+=loss.item()
            #求正确数（分类特有的）
            accuracy=(outputs.argmax(1)==targets).sum()
            total_accuracy+=accuracy
    print(f"整体测试集的Loss:{total_test_loss}")
    print(f"整体测试集的正确率:{total_accuracy/test_set_size}")
    writer.add_scalar("test_total_loss",total_test_loss,i+1)
    writer.add_scalar("test_total_accuracy",total_accuracy/test_set_size,i+1)

    #保存每一轮的模型训练结果
    torch.save(model_classification,f"model{i+1}.pth")
    print("模型已保存")

writer.close()

原文地址：https://blog.csdn.net/2302_79795489/article/details/143027468

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：LeetCode123：买卖股票的最佳时机III
下一篇：java学习--集合（大写五.5）

FPGA实现PCIE与电脑端QT上位机双向数据传输，基于XDMA中断模式，提供3套工程源码和技术支持
FPGA实现PCIE与电脑端QT上位机双向数据传输，基于XDMA中断模式，提供9套工程源码和技术支持
阅读更多2024-10-18
SpringBoot智能物流管理系统开发指南
在概念模式的设计中，E-R模型法是最常见的设计方法。B/S架构的运行方式是在远程的服务器上把开发的软件系统部署在远程的服务器上，在部署好软件系统之后就可以实现在任何接入互联网的电脑上访问部署好的软件系
阅读更多2024-10-18
docker删除容器要怎么操作？如何保障容器安全！
攻击者使用越来越多的高级技术入侵容器，而供应链攻击是云原生安全面临的较大问题，恶意镜像比较容易构造，绕过杀软的静态检测。可以清晰地盘点工作负载本身的相关信息，此外，还能够实现不同工作负载之间的关系可视
阅读更多2024-10-18
html5的简单问题
语义化更好的内容元素；cookies是网站为了标示用户身份而存储在用户本地终端上的数据，cookies数据始终在同源的http请求中携带，在浏览器和服务器间来回传递。导致回流现象的操作：添加或删除可见
阅读更多2024-10-18
uniapp-vue3-vite 搭建小程序、H5 项目模板
搭建一个使用和的小程序与 H5 项目模板相对简单，下面将详细介绍步骤，包括环境配置、项目创建、代码结构和基本示例。
阅读更多2024-10-18
python2与python3之间的区别
Python 2 和 Python 3 之间存在许多重要的区别。
阅读更多2024-10-18
EtherCAT总线轴实际速度和实际转矩滤波(一阶低通滤波器和TD跟踪微分器滤波对比测试)
.....
阅读更多2024-10-18
宝塔面板+HYBBS搭建私有BBS结合内网穿透一键发布论坛至公网访问
本文主要为大家介绍，如何使用HYBBS在Ubuntu系统上搭建一个好看、轻巧且扩展功能强大的论坛网站，并结合内网穿透工具发布公网随时远程访问。在国内互联网刚刚起步时，网民上网大多数时候只能浏览门户网站
阅读更多2024-10-18
自动驾驶系列—CI在自动驾驶开发中的应用场景与实现详解
随着自动驾驶技术的迅猛发展，现代车辆变得越来越智能化。越来越多的车辆功能和特性不再依赖于硬件，而是通过软件来实现。这使得自动驾驶系统的开发变得更加复杂，尤其是需要频繁更新的自动驾驶算法和控制逻辑。在如
阅读更多2024-10-18
Android打开Activity时不自动弹出键盘
在一个页面有2个EditText输入框，刚进入activity的时候系统默认第一个EditText获得焦点且键盘弹出。只需要到配置文件增加以下配置即可。这里分2种情况处理。
阅读更多2024-10-18