利用GPU进行训练

🕗 发布于 2024-10-05 21:01 python 机器学习 计算机视觉神经网络 深度学习

文章目录

一、GPU训练模型

GPU只能够训练三种变量，分别是：

网络模型
数据（输入，标注targets）
损失函数

使用方式是.cuda()

除了以上的三种，在别的地方是引用不上cuda的。

使用方式：

1.网络模型

#创建网络模型
class Sen(nn.Module):
    def __init__(self):
        super(Sen, self).__init__()
        self.model = nn.Sequential(
            nn.Conv2d(3, 32, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 32, 5, 1 ,2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 64, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Flatten(),
            nn.Linear(64*4*4, 64),
            nn.Linear(64, 10)
        )
    def forward(self,x):
        x = self.model(x)
        return x
sen = Sen()
sen.cuda()

2、损失函数

#损失函数
loss_fn = nn.CrossEntropyLoss()
loss_fn = loss_fn.cuda()

3、数据

    for data in train_dataloader:
        imgs, targets = data
        imgs = imgs.cuda()
        targets = targets.cuda()
        outputs = sen(imgs)
        loss = loss_fn(outputs, targets)

如果电脑上没有GPU的话，以上这么写会发生报错，更好的写法应该是加上if判断是否有GPU
例下：

if torch.cuda.is_available():
    sen.cuda()

if torch.cuda.is_available():
loss_fn = loss_fn.cuda()

if torch.cuda.is_available():
  imgs = imgs.cuda()
  targets = targets.cuda()

这样可以保证有gpu先试用gpu，没有gpu也能够正常运行。

二、对比使用gpu和cpu进行训练所花费的时间

引入记录时间函数：

import time

start_time = time.time()

end_time = time.time()

print(f"使用gpu训练使用的时间{end_time - start_time}")

在模型训练开始与结束时候分别记录start_time和end_time:

start_time = time.time()
for i in range(epoch):
    print(f"-------第{i+1}轮训练开始-------")

    #训练步骤开始
    sen.train()
    for data in train_dataloader:
        imgs, targets = data
        imgs = imgs.cuda()
        targets = targets.cuda()
        outputs = sen(imgs)
        loss = loss_fn(outputs, targets)

        #优化器模型
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step = total_train_step + 1
        if total_train_step % 100 == 0:
            end_time = time.time()
            print(f"使用gpu训练使用的时间{end_time - start_time}")
            print(f"训练次数：{total_train_step}，Loss：{loss.item()}")
            writer.add_scalar("train_loss", loss.item(), total_train_step)

1.使用gpu训练结果：
在这里插入图片描述

可以看到平均100次只使用1s。

2.使用cpu进行训练结果：
在这里插入图片描述
可以看到没训练100次花费时间是7s

因此使用gpu进行训练模型能大大提升算力。

三、GPU训练模型的第二种表达方式

先定义训练的设备：

device = torch.device("cpu")

再在变量当中调用

sen = Sen()
sen = sen.to(device)

#损失函数
loss_fn = nn.CrossEntropyLoss()
loss_fn = loss_fn.to(device)

     imgs, targets = data
     imgs = imgs.to(device)
     targets = targets.to(device)

调用gpu只需要改变训练模型即可，变量当中依旧用.to(device)：

device = torch.device("cuda")

‘：0’的写法等同于cuda

device = torch.device("cuda:0")

如果电脑上有两个不同的gpu，可以用以下调用第二个gpu进行训练

device = torch.device("cuda:1")

为了适用于不同环境，可以用以下代码来写：

device = torch.device("cuda" if torch.cuda.is_acailable() else "cpu")

原文地址：https://blog.csdn.net/Mr_Happy_Li/article/details/142659117

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：直立行走机器人技术概述
下一篇：[Linux]从零开始的网站搭建教程

FPGA时序分析和约束学习笔记（2、FPGA时序传输模型）
Tsu建立时间：目的寄存器自身的特性决定，在时钟上升沿到达其时钟接口时，其数据输入端（D）的数据必须提前Nns稳定下来，否则就无法确保数据正确存储。Skew时钟偏斜：时钟从源端口出发，到达目的寄存器和
阅读更多2024-10-06
打卡第一天 B2005 字符三角形
【代码】打卡第一天 B2005 字符三角形。
阅读更多2024-10-06
IEC104规约的秘密之六----配置参数k，w
w是通讯前就已经配置好的一个固定值，范围是1~32767，表示收到对方w帧后就必须给对方一个应答了，表示这些帧我已经收到了，如果不给对方应答，对方会认为自己发的这些帧没有收到，后续可以采用其他机制来让
阅读更多2024-10-06
算法闭关修炼百题计划（二）
给你一个整数数组 nums，返回数组 answer ，其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积。根据这一点，用哈希表分组，把排序后的字符串当做key，原字
阅读更多2024-10-06
C# 数组和集合
数组是具有相同数据类型的一组数据的集合。数组中的每一个变量称为数组的元素，数组能够容纳元素的数量称为数组的长度。
阅读更多2024-10-06
UE5 小地图的基础方法
UE5 平面小地图的基础方法，后续继续添加
阅读更多2024-10-06
第33次CCF计算机软件能力认证【T1~T3】：词频统计、相似度计算、化学方程式配平
CCF计算机软件能力认证，前三题包括大模拟、高斯消元、枚举等操作
阅读更多2024-10-06
洛谷刷题 P1042 [NOIP2003 普及组] 乒乓球
接着我们对二维数据循环访问处理数据，对11制和21制一轮结束情况做讨论，注意if，else if的使用（是并行情况还是多选一情况）那么数据存储我们可以用C++的vector<char>，或
阅读更多2024-10-06
spring boot发送邮件
spring boot整合mail发送邮件
阅读更多2024-10-06
银行数字化转型导师坚鹏：2025年银行开门红蓄客方法及案例
银行营销、运营、数字化营销、数字化运营、网点负责人、中高层干部等相关人员。3、第三个难题：银行需要做哪些准备工作？4、第四个难题：如何抛开疑虑、放手去做？1、第一个难题：银行锁定哪些目标客户？2
阅读更多2024-10-06

利用GPU进行训练

文章目录

一、GPU训练模型

二、对比使用gpu和cpu进行训练所花费的时间

三、GPU训练模型的第二种表达方式

相关文章