动手学深度学习（pytorch土堆）-06损失函数与反向传播、模型训练、GPU训练

🕗 发布于 2024-09-24 16:30 深度学习 pytorch 人工智能

在这里插入图片描述

模型保存与读取

完整模型训练套路

import torch
import torchvision.datasets
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

from model import *

train_data=torchvision.datasets.CIFAR10("data_nn",train=True,transform=torchvision.transforms.ToTensor(),
                                    download=True )
test_data=torchvision.datasets.CIFAR10("data_nn",train=False,transform=torchvision.transforms.ToTensor(),
                                    download=True )
train_data_size=len(train_data)
test_data_size=len(test_data)
print(test_data_size,train_data_size)

train_dataloader=DataLoader(train_data,batch_size=64)
test_dataloader=DataLoader(test_data,batch_size=64)
#搭建神经网络

XKK=xkkk()
#损失函数
loss_fn=nn.CrossEntropyLoss()
#优化器
learning_rate=0.01
optimizer=torch.optim.SGD(XKK.parameters(),lr=learning_rate)
#设置训练网络的一些参数
total_test_step=0
#训练的轮数
epoch=10
#添加tensorboard
writer=SummaryWriter("logs_train")
for i in range(epoch):
    print("----第{}轮训练开始----".format(i+1))
    for data in train_dataloader:
        imgs,targets=data
        outputs=XKK(imgs)
        loss=loss_fn(outputs,targets)
        #优化器调优，优化模型
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        total_test_step=total_test_step+1
        if total_test_step%100==0:
            print("训练次数：{}，loss:{}".format(total_test_step,loss))
            writer.add_scalar("train_loss",loss.item(),total_test_step)
  #测试步骤开始
    total_test_loss=0
    with torch.no_grad():
        for data in test_dataloader:
            imgs,targets=data
            outputs=XKK(imgs)
            loss=loss_fn(outputs,targets)
            total_test_loss=total_test_loss+loss
    print("整体测试集上的Loss:{}".format(total_test_loss))
    writer.add_scalar("test_loss",total_test_loss,total_test_step)
    total_test_step=total_test_step+1
writer.close()

在这里插入图片描述

使用GPU训练

import time

import torch
import torchvision.datasets
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

# from model import *

train_data=torchvision.datasets.CIFAR10("data_nn",train=True,transform=torchvision.transforms.ToTensor(),
                                    download=True )
test_data=torchvision.datasets.CIFAR10("data_nn",train=False,transform=torchvision.transforms.ToTensor(),
                                    download=True )
train_data_size=len(train_data)
test_data_size=len(test_data)
print(test_data_size,train_data_size)

train_dataloader=DataLoader(train_data,batch_size=64)
test_dataloader=DataLoader(test_data,batch_size=64)
#搭建神经网络

class xkkk(torch.nn.Module):
    def __init__(self):
        super(xkkk,self).__init__()
        self.model1=torch.nn.Sequential(
            Conv2d(3, 32, 5,1, padding=2),
            MaxPool2d(kernel_size=2),
            Conv2d(32, 32, 5, 1,padding=2),
            MaxPool2d(kernel_size=2),
            Conv2d(32, 64, 5,stride=1, padding=2),
            MaxPool2d(kernel_size=2),
            Flatten(),
            Linear(in_features=64*4*4, out_features=64),  # 1024=64*4*4,
            Linear(64, 10)
        )
    def forward(self, x):

        output=self.model1(x)
        return output
XKK=xkkk()
XKK=XKK.cuda()
#损失函数
loss_fn=nn.CrossEntropyLoss()
loss_fn=loss_fn.cuda()
#优化器
learning_rate=0.01
optimizer=torch.optim.SGD(XKK.parameters(),lr=learning_rate)
#设置训练网络的一些参数
total_test_step=0
#训练的轮数
epoch=10
#添加tensorboard
writer=SummaryWriter("logs_train")
start_time=time.time()
for i in range(epoch):
    print("----第{}轮训练开始----".format(i+1))
    for data in train_dataloader:
        imgs,targets=data
        imgs=imgs.cuda()
        targets=targets.cuda()
        outputs=XKK(imgs)
        loss=loss_fn(outputs,targets)
        #优化器调优，优化模型
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        total_test_step=total_test_step+1
        if total_test_step%100==0:
            end_time=time.time()
            print(end_time-start_time)
            print("训练次数：{}，loss:{}".format(total_test_step,loss))
            writer.add_scalar("train_loss",loss.item(),total_test_step)
  #测试步骤开始
    total_test_loss=0
    with torch.no_grad():
        for data in test_dataloader:
            imgs,targets=data
            imgs = imgs.cuda()
            targets = targets.cuda()
            outputs=XKK(imgs)
            loss=loss_fn(outputs,targets)
            total_test_loss=total_test_loss+loss.item()
    print("整体测试集上的Loss:{}".format(total_test_loss))
    writer.add_scalar("test_loss",total_test_loss,total_test_step)
    total_test_step=total_test_step+1
    torch.save(XKK,"XKK_{}.pth".format(i))
    print("模型已保存")
writer.close()

CPU训练时间如下
在这里插入图片描述

使用GPU训练时间如下
在这里插入图片描述
对比可知GPU训练速度提升5倍左右

GPU代码区CPU区别如下
在这里插入图片描述
只需要改动网络模型、数据、损失函数，调用它们对应的.cuda()。

方式2
在这里插入图片描述

#定义训练的设备
#device=torch.device("cpu")#使用cpu
device=torch.device("cuda")#使用GPU
....
XKK=xkkk()
XKK=XKK.to(device)
......
 imgs=imgs.to(device)
 targets=targets.to(device)

.....

测试

import torch
import torchvision.transforms
from PIL import Image
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear

image_path="imgs/dog.png"

image = (Image.open(image_path).convert("RGB"))
#image=Image.open(image_path)
transform=torchvision.transforms.Compose([torchvision.transforms.Resize((32,32)),
                                          torchvision.transforms.ToTensor()
                                          ])
image=transform(image)

class xkkk(torch.nn.Module):
    def __init__(self):
        super(xkkk,self).__init__()
        self.model1=torch.nn.Sequential(
            Conv2d(3, 32, 5,1, padding=2),
            MaxPool2d(kernel_size=2),
            Conv2d(32, 32, 5, 1,padding=2),
            MaxPool2d(kernel_size=2),
            Conv2d(32, 64, 5,stride=1, padding=2),
            MaxPool2d(kernel_size=2),
            Flatten(),
            Linear(in_features=64*4*4, out_features=64),  # 1024=64*4*4,
            Linear(64, 10)
        )
    def forward(self, x):

        output=self.model1(x)
        return output
model=torch.load("XKK_9.pth",map_location=torch.device("cpu"))
print(model)
print(image.size())

image=torch.reshape(image,(1,3,32,32))
model.eval()
with torch.no_grad():
    output=model(image)
print(output)
print(output.argmax(1))

输入一张小狗图片

image_path="imgs/dog.png"

结果
tensor([5])

在这里插入图片描述

在这里插入图片描述
输入一张飞机图片

image_path="imgs/airplane.png"
结果
tensor([0])

可以看出预测准确

原文地址：https://blog.csdn.net/qq_54714615/article/details/142331339

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：lunar无第三方依赖的公历、农历、法定节假日...日历工具库
下一篇：【更新日志】拉克丝大战亚索-2024.09.23

Nginx反向代理简介，作用及配置；Nginx负载均衡简介，作用及配置；
Nginx反向代理简介，作用及配置；Nginx负载均衡简介，作用及配置；
阅读更多2024-09-25
如何设置网络黑名单禁止某些用户访问
设置网络黑名单以禁止某些用户访问你的网络资源通常涉及使用防火墙、路由器设置或服务器配置。以下是一些常见的方法：大多数防火墙（无论是硬件防火墙还是软件防火墙）都允许你创建黑名单来阻止特定IP地址或MAC
阅读更多2024-09-25
C++的哲学思想
C++的设计哲学：1. C++底层不应该基于任何其他语言 2.只为使用的东西付费 3.以低成本提供高级抽象
阅读更多2024-09-25
在 Visual Studio （VS2015）中搜索时使用正则表达式
在Visual Studio 2015（VS2015）中，使用搜索（通常是查找和替换功能）时，可以启用正则表达式模式来执行更复杂的文本匹配和替换操作。
阅读更多2024-09-25
JVM 的性能指标监测
JVM性能指标监测。
阅读更多2024-09-25
网站深色浅色切换案例-单页面，非全局。
【代码】网站深色浅色切换案例-单页面，非全局。
阅读更多2024-09-25
Leecode_SQL50_1280. Students and Examinations
注意一定要选择 a.subject_name！因为只有这个表是全的。若选择错了，有人的 subject_name 会是 null.用 CROSS JOIN 获取所有学生和科目的组合，不用有相同的列来
阅读更多2024-09-25
企微私域助手：重塑企业营销新生态的智能引擎
它不仅帮助企业高效管理私域流量，提升营销效率与转化率，更重要的是，通过深度链接用户，构建了长期稳定的用户关系，为企业的可持续发展奠定了坚实基础。3、内容营销与自动化营销：支持内容库管理，企业可预设营销
阅读更多2024-09-25
信息技术的快速发展与未来展望
近年来，信息技术（IT）的迅猛发展给全球经济、社会和个人生活带来了深刻的变革。无论是大数据、云计算，还是人工智能、物联网等技术，IT技术的进步正不断推动着各行各业的数字化转型。本文将探讨当前信息技术的
阅读更多2024-09-25
【C++进阶】2024年了set、map还搞不懂底层细节？
关联式容器也是用来存储数据的，与序列式容器不同的是，关联式容器里面存的是结构的键值对，在数据检索时比序列式容器效率更高。set：存储唯一键的集合multiset：存储可以有重复键的集合map：存储唯一
阅读更多2024-09-25

动手学深度学习（pytorch土堆）-06损失函数与反向传播、模型训练、GPU训练

使用GPU训练

测试

相关文章