2024/9/18 模型训练流程、利用GPU训练

🕗 发布于 2024-09-19 15:45 深度学习 人工智能

以CIFAR10数据集为例：

代码在train.py 网络模型在module.py

一、模型训练流程

1.获取数据集

可用len获取数据长度

2.使用DataLoader从数据集中获取数据

3.构建网络模型

一般网络模型会单独建立一个模块进行存放，若要使用，在使用模块进行引用

if __name__ == '__main__':下的代码多用于当前模块的测试

4.创建模型对象，损失函数，优化器

5.创建一些模型参数

6.训练过程

小知识：对于item函数

7.测试步骤

8.后续还可加入tensorboard可视化，将每一轮的模型进行保存

9.还可计算现有模型对测试数据的正确率

每个数据经过模型转化后都是一个长度为10的一维数组，数组由不同的数值组成，一行中数值最大的那个数的下标索引就是其所属类别，可用argmax获得一行数据中最大值的下标索引

由于batch为64，所以每次模型出来的批数据是个维度为[64,10]的二维数组out

out.argmax(1) 表示对64行，每行求最大值下标索引，会生成这批数据用模型进行分类的结果，是一个长度为64的一维数组。

将模型所预测的结果与数据本身类别进行比较，求出预测正确率

二、利用GPU训练

方式一：对象.cuda()

代码见 train_gpu.py

CUDA 是 NVIDIA 发明的一种并行计算平台和编程模型。它通过利用图形处理器 (GPU) 的处理能力，可大幅提升计算性能。

cuda应用于：

方式二：.to(device)

这种方式首先需要定义device:

对于显卡上只有单个GPU，cuda == cuda:0

若有多个可指定

常用写法：

对象通过.to()进行调用

注：两种方式适用对象相同

原文地址：https://blog.csdn.net/m0_58285219/article/details/142340307

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Day.js时间插件的安装引用与常用方法大全
下一篇：[Linux]从零开始的泰山派系统安装与远程教程

水库抽样算法（大数据算法作业）
水库抽样技术归根到底就是在总体容量未知的情况下，仅通过单遍扫描数据集便能生成等概率抽样集合的一种均匀抽样技术。代码或许很简单，但是其中的数学知识以及思想方法是很值得学习的！
阅读更多2024-10-16
【C语言】--数组
😊个人主页: 起名字真南😋个人专栏:【数据结构初阶】【C语言】【C++】数组是一组相同类型元素的集合：一维数组创建的基本语法如下：存放在数组中的值被称为数组元素，数组在创建的时候可以指定数组的大
阅读更多2024-10-16
专题十一_递归_回溯_剪枝_综合练习_算法专题详细总结
这一题相对来说还是十分简单的，就是上一个专题的最后一题求子集，只要递归函数体能写对，那怎么写这题都能过。2.全排列 Ⅱ（medium）题意很简单就是对全排列后的所有数组添加到ret后去掉所有重复的数组
阅读更多2024-10-16
MySQL insert 记录后查询是乱码问题分析
MySQL客户端和服务器通信过程中的字符集处理
阅读更多2024-10-16
java怎么连接数据库sql server
在Java中，可以使用JDBC（Java Database Connectivity）来连接和操作SQL Server数据库。要实现这一点，你需要SQL Server的JDBC驱动程序，并编写Java
阅读更多2024-10-16
常用STL的操作以及特点
STL 提供了强大的数据结构和算法库，使得开发者可以快速、高效地解决许多常见的问题。每种容器和算法。
阅读更多2024-10-16
【优选算法】——双指针(下篇)！
b、如果大于，count+=（right-left ），固定max和right两边后，left是right之后最小的一边。2、排序后，我们定义target在len-1的位置，left=0，right=
阅读更多2024-10-16
python自动化办公实例（使用openpyxl、os处理统计Excel表中的数据并将其合并）
这里的手动处理可以通过优化我们的代码来进行一些简化以减少我们的工作量（如其他列不用删只要把奖项这里的列名进行统一就好了、文件名其实也可以不用进行重命名可以直接用我们之前的名字这样不仅可以减少工作量又可
阅读更多2024-10-16
王道考研视频——操作系统笔记第三章：内存管理
内存管理（ Memory Management）是操作系统设计中最重要和最复杂的内容之一。操作系统对内存的划分和动态分配，就是内存管理的概念
阅读更多2024-10-16
[搜索] 质数
给定n个正整数，将它们分组，使得每组中任意两个数互质。至少要分成多少个组？在满足最少的组数的情况下，使得元素个数最多的那一组的元素个数尽可能的少。
阅读更多2024-10-16

2024/9/18 模型训练流程、利用GPU训练

一、模型训练流程

二、利用GPU训练

方式一：对象.cuda()

方式二：.to(device)

相关文章