12.06 深度学习-预训练

🕗 发布于 2024-12-07 18:20 深度学习 人工智能

# 使用更深的神经网络经典神经网络

import torch

import cv2

from torchvision.models import resnet18,ResNet18_Weights

from torch import optim,nn

from torch.utils.data import DataLoader

from torchvision.datasets import CIFAR10

from torchvision import transforms

def demo1():

data_train=CIFAR10(root="assets",download=False,train=True,transform=transforms.Compose([transforms.ToTensor()]))

# # 获取权重

# weight=ResNet18_Weights.IMAGENET1K_V1 # 1000分类的权重文件

# net1=resnet18(weights=weight) #设置这个模型的权重

# # 把权重保存了这里不能直接训练因为这个net1的fc还不是 10输出

# torch.save(net1.state_dict(),"assets/model_pre.pt")

# return

# 获取模型

net1=resnet18(weights=None)

# 获取fc 的输入特征数迁移学习是网络结构有变化的如果没有变化就是继续训练就不是迁移学习

in_features=net1.fc.in_features

# 可以去改模型的层次结构根据自己的数据来被改的层次都要重新进行训练不仅是fc了被改的层次不能冻结而且权重参数也要删掉

net1.fc=nn.Linear(in_features=in_features,out_features=10,bias=True)

net1.conv1=nn.Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(3, 3), bias=False)

# 加载预训练权重

state_dict=torch.load("assets/model_pre.pt",weights_only=True)

# 线性层的预训练权重不需要

state_dict.pop("fc.weight")

state_dict.pop("fc.bias")

state_dict.pop("conv1.weight")

# state_dict.pop("conv1.bias")

# 更新模型的权重参数

# net1.load_state_dict(state_dict) # 会少keys 不能用

my_weight=net1.state_dict()

my_weight.update(state_dict)

net1.load_state_dict(my_weight)

# 冻结层的使用现在这个模型net1 只有fc需要进行训练其他层都训练好了给其他层冻结了只训练fc层 model.parameters()返回model的每一层权重和偏置的tensor 的迭代器可以遍历它 named_parameters多返回一个名字

# 把要冻结的层的权重和偏置的tensor的requires_grad=True 全设为Flase 在把model.parameters()给优化器要过滤掉 requires_grad=Flase的

for name,param in net1.named_parameters():

param.requires_grad=False

for name,param in net1.named_parameters():

if name =="fc.weight" or name =="fc.bias" :

param.requires_grad=True

for name,param in net1.named_parameters():

if name =="conv1.weight" :

param.requires_grad=True

# 过滤掉 requires_grad=Flase的权重参数

true_weight=filter(lambda p:p.requires_grad,net1.parameters())

dataLoader1=DataLoader(data_train,batch_size=16,shuffle=True)

# 循环轮次

epochs=2

# 优化器

optim1=optim.Adam(true_weight,lr=0.01)

# 损失函数

loss_func=nn.CrossEntropyLoss()

# 开始训练

for i in range(epochs):

for x_train,y_train in dataLoader1:

# 前向传播

y_pre=net1(x_train)

# 损失

loss=loss_func(y_pre,y_train)

# 清空梯度

optim1.zero_grad()

# 反向

loss.backward()

# 梯度更新

optim1.step()

torch.save(net1.state_dict(),"assets/model3.pt")

# 预训练先用一组数据对模型进行训练然后在把这个模型拿出来继续训练

# resnet18 有一个1000分类的预训练数据这个数据拿过来改把resnet18模型的线性层改为10分类然后再把1000分类的预训练数据初始化给这个模型进行再训练

# 需要注意的是先初始化一个这个1000分类的模型然后保存他的权重

# # # 获取权重

# weight=ResNet18_Weights.IMAGENET1K_V1

# net1=resnet18(weights=weight)

# # 把权重保存了这里不能直接训练因为这个net1的fc还不是 10输出

# torch.save(net1.state_dict(),"assets/model_pre.pt")

print("完成")

# 在初始化另一个来改fc

pass

def demo2(): # 用训练的模型对图片进行分类

# 获得模型

net1=resnet18(weights=None)

in_features=net1.fc.in_features

net1.fc=nn.Linear(in_features=in_features,out_features=10,bias=True)

# 加载模型数据

net1.load_state_dict(torch.load("assets/model3.pt",weights_only=True))

# 加载图片数据训练数据是一个二维的数组 RGB

img=cv2.imread("assets/qw.jpg")

img=cv2.cvtColor(img,cv2.COLOR_BGR2RGB)

img=cv2.resize(img,(32,32))

# 转为tensor

img=torch.tensor(img,dtype=torch.float32)

# 换维度

img=img.permute(2,0,1)

# 升一个维度

img=img.unsqueeze(0)

# print(img.shape)

# 推理

net1.eval()

with torch.no_grad():

res=net1(img)

func=nn.Softmax()

res=func(res)

print(res)

print(torch.argmax(res,dim=1))

pass

def demo3():

# 获得模型

net1=resnet18(weights=None)

in_features=net1.fc.in_features

net1.fc=nn.Linear(in_features=in_features,out_features=10,bias=True)

# 加载模型数据

net1.load_state_dict(torch.load("assets/model3.pt",weights_only=True))

data_test=CIFAR10(root="assets",download=False,train=False,transform=transforms.Compose([transforms.ToTensor()]))

data_loader1=DataLoader(data_test,shuffle=True,batch_size=32)

acc=0

i=0

for x_test,y_test in data_loader1:

# 推理

net1.eval()

with torch.no_grad():

res=net1(x_test)

func=nn.Softmax()

res=func(res)

res=torch.argmax(res,dim=1)

acc+=sum(res==y_test)/len(y_test)

i+=1

print(acc/i)

pass

if __name__=="__main__":

demo1()

# demo2()

# demo3()

pass

原文地址：https://blog.csdn.net/2401_86807530/article/details/144298090

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：阿里的fastjson中JSONObject.parseObject和JSON.parseObject区别和联系？
下一篇：阿里的fastjson中JSONObject.parseObject和JSON.parseObject区别和联系总结

.NET(C#) 如何配置用户首选项及保存用户设置
.NET(C#) 如何配置用户首选项及保存用户设置
阅读更多2024-12-14
【最新】北大数字普惠金融指数数据集-省市县（2011-2023年）
郭峰,王靖一,王芳,孔涛,张勋,程志云.测度中国数字普惠金融发展:指数编制与空间特征[J].经济学(季刊),2020,19(04):1401-1418.时间跨度：省级和城市级指数时间跨度为2011-2
阅读更多2024-12-14
GESP202412 四级【Recamán】题解（AC）
a11ak−1−kkakak−1−kak−1k小杨想知道 Recamán 数列的前n项从小到大排序后的结果。手动计算非常困难，小杨希望你能帮他解决这个问题。
阅读更多2024-12-14
IDEA遇到EasyConnect中的网络资源无法访问的问题
版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。原文链接：https://blog.csdn.net/wanshanyu_/article/de
阅读更多2024-12-14
双目摄像头标定方法
此时已经完成标定，左下角为反投影误差，右边为外参可视化。将双目左右目拍的图像上传（左右目最好不少于20张）此时回到主页面，即可看到成功导出。把这些误差大的删除即可。
阅读更多2024-12-14
Servlet、omcat服务器架构与工作原理
Servlet是运行在服务器端的Java程序，它的主要职责之一是接收并处理来自客户端（如浏览器）的HTTP请求。当客户端发送一个请求到服务器时，Servlet可以解析请求中的信息，例如请求的URL路径
阅读更多2024-12-14
Vue生命周期钩子函数：深入解析与实践
作为高级Vue前端开发人员，对Vue组件的生命周期钩子函数有着深刻的理解是至关重要的。生命周期钩子函数是指在Vue组件的创建、更新、销毁等过程中，Vue自动调用的一系列方法。通过这些钩子函数，我们可以
阅读更多2024-12-14
安卓开发--使用android studio发布APP
app发布
阅读更多2024-12-14
数据结构与算法学习笔记----拓扑排序
@ author: 明月清了个风。
阅读更多2024-12-14
python 将数据保存到现有的Excel文件的新工作表
out_file = ‘query.xlsx’df1 = pd.DataFrame(out_data)若直接写入：df1.to_excel(out_file, index=False, sheet_n
阅读更多2024-12-14

12.06 深度学习-预训练

相关文章