《深度学习》迁移学习综合应用原理、案例解析与实现

import torch
import torchvision.models as models
from torch import nn
from torch.utils.data import DataLoader,Dataset
from torchvision import transforms
from PIL import Image
import numpy as np


""" 将ResNet18模型迁移到食物分类项目中 """   # 残差网络是固定的网络结构，不需要自己来类定义
resnet_model = models.resnet18(weights = models.ResNet18_Weights.DEFAULT)  # 即调用了resnet18网络，又使用了训练好的模型
# weights=models.ResNet18_Weights.DEFAULT表示使用在 ImageNet 数据集上预先训练好的权重来初始化模型参数,可进入源代码查看
for param in resnet_model.parameters():  # 遍历模型的所有参数
    print(param)
    param.requires_grad = False
# 模型所有参数(即权重和偏差)的requires_grad属性设置为False，从而冻结所有模型参数

# 使得在反向传播过程中不会计算它们的梯度，以此减少模型的计算量，提高理速度。
in_feature = resnet_model.fc.in_features  # 获取原始模型全连接层fc的输入特征in_feature
resnet_model.fc = nn.Linear(in_feature,20)     # 创建一个全连接层，输入特征为in_features，输出为20，将其赋值给原先的全连接层

params_to_update = []
for param in resnet_model.parameters():   # 再次遍历模型的所有参数，
    if param.requires_grad == True:   # 判断模型参数的属性是否为需要更新，如果是，那么将其参数值增加到列表中，因为我们更改了全连接层，所以此处所有的参数为全连接层的参数
        params_to_update.append(param)

3、数据增强处理

data_transforms = {
    'train':    # 训练集
        transforms.Compose([  # 用来整合图片的数据增强处理
            transforms.Resize([300,300]),   # 将输入的图片尺寸缩放到300*300
            transforms.RandomRotation(45),   # 做数据增强，随机旋转-45-45度
            transforms.CenterCrop(224),   # 对图片做中心裁剪，裁剪为224*224大小
            transforms.RandomHorizontalFlip(p=0.5),   # 随机水平翻转，概率为0.5
            transforms.RandomVerticalFlip(p=0.5),   # 随机垂直翻转，概率为0.5
            # transforms.ColorJitter(brightness=0.2,contrast=0.1,saturation=0.1,hue=0.1),   # 随机更改对比度、饱和度、、
            transforms.RandomGrayscale(p=0.1),   # 随机更改为灰度图，概率为0.1
            transforms.ToTensor(),   # 将图像格式转变为tensor类型
            transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])   # 对图像做归一化，指定均值，标准差
        ]),
    'valid':    # 验证集
        transforms.Compose([
            transforms.Resize([224,224]),
            transforms.ToTensor(),
            transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])

        ])
}

4、导入图像并打包

1）文件内容

train.txt文件内容如下：

test.txt文件内容同上。

其中地址分别对应相应的图片，尾部数字代表类别：

2）代码部分

class food_dataset(Dataset):   # 继承Dataset，food_dataset是自己创建的类名称，可以改为你需要的名称
    def __init__(self,file_path,transform=None):   # 类的初始化,传入参数为图片地址及其标签，数据增强默认为None，解析数据文件txt
        self.file_path = file_path   # 图片地址及其标签传入self空间
        self.imgs = []   # 存放图片
        self.labels = []  # 存放图片标签
        self.transform = transform   # 数据增强
        with open(self.file_path) as f:  # 是把train.txt文件中图片的路径保存在 self.imgs,train.txt
            samples = [x.strip().split(' ') for x in f.readlines()]
            for img_path,label in samples:
                self.imgs.append(img_path)   # 图像的路径
                self.labels.append(label)     # 标签,还不是tensor
# 初始化:把图片目录加载到self.

    def __len__(self):    # 类实例化对象后，可以使用len函数测量对象的个数
        return len(self.imgs)

    def __getitem__(self, idx):   # 关键，可通过idx索引的形式获取每一个图片数据及标签
        image = Image.open(self.imgs[idx])   # 读取到图片数据，还不是tensor
        if self.transform:    # 将pil图像数据转换为tensor
            image = self.transform(image)   # 图像处理为256*256，转换为tenor

        label = self.labels[idx]   # label还不是tensor
        label = torch.from_numpy(np.array(label,dtype=np.int64))
        return image,label   # 返回图片及其标签信息

# 传入训练集和测试集图片地址，分比对他们进行数据增强处理
training_data = food_dataset(file_path = './trainda.txt',transform = data_transforms['train'])
test_data = food_dataset(file_path ='./testda.txt',transform = data_transforms['valid'])

# 对返回的图片信息做打包处理，每64张打包成一份
train_dataloader = DataLoader(training_data,batch_size=64,shuffle=True)
test_dataloader = DataLoader(test_data,batch_size=64,shuffle=True)

# 确定使用的设备是cpu还是GPU
device = "cuda" if torch.cuda.is_available() else "mps" if torch.backends.mps.is_available() else "cpu"
print(f"Using {device} device")

5、损失函数、优化器、调整学习率

# 将上述微调的残差网络结构传入GPU
model = resnet_model.to(device)   # 为什么不需要加括号，resnet_model是一个对象而不是一个类

loss_fn = nn.CrossEntropyLoss()   # 创建交叉熵损失函数对象，因为手写字识别中一共有10个数字，输出会有10个结果
optimizer = torch.optim.Adam(params_to_update,lr=0.001)   # 仅训练部分参数，即params_to_update，其为上述全连接层的参数
# optimizer = torch.optim.Adam(resnet_model.parameters(),lr=0.001)   # 训练更新模型所有层参数
scheduler = torch.optim.lr_scheduler.StepLR(optimizer,step_size=5,gamma=0.5)  # 调整学习率，每进行轮训练后，将学习率乘以0.5

6、定义训练集

def train(dataloader,model,loss_fn,optimizer):  # 传入打包好的数据，预定义的残差网络模型，损失函数，优化器
    model.train()   # 模型进行训练模式
    batch_size_num = 1
    for x,y in dataloader:  # 遍历每个打包的图片的信息及标签
        x,y = x.to(device), y.to(device)  # 把训练数据集和标签传入cpu或GPl
        pred = model.forward(x)   # 模型进行前向传播
        loss = loss_fn(pred, y)   # 通过交叉熵损失函数计算损失值Loss

        optimizer.zero_grad()  # 梯度值清零
        loss.backward()     # 反向传播计算得到每个参数的梯度
        optimizer.step()   # 根据梯度更新网络参数

        loss = loss.item()   # 获取损失值
        if batch_size_num % 100 == 0:   # 每100轮打印一次损失值和轮数
            print(f"loss: {loss:>7f}[number:{batch_size_num}]")
        batch_size_num += 1

7、定义测试集

bast_acc = 0
def test(dataloader, model,loss_fn):
    global bast_acc   # 定义全局变量
    size = len(dataloader.dataset)   # 返回所有的图片个数
    num_batches = len(dataloader)   # 返回打包的包个数
    model.eval()    # 模型进入测试模式
    test_loss,correct = 0,0   # 初始化总损失值和准确的总个数为0
    with torch.no_grad():   # 一个上下文管理器，关闭梯度计算。当你确认不会调用Tensor.backward()时可以减少
        for x,y in dataloader:
            x,y= x.to(device),y.to(device)
            pred = model.forward(x)
            test_loss += loss_fn(pred,y).item()
            correct +=(pred.argmax(1)== y).type(torch.float).sum().item()   # 判断预测结果是否等于真实值，返回布尔值，将其转换为0、1，然后求和，在转换为python标量

        test_loss /= num_batches
        correct /= size
        print(f"Test result:in Accuracy: {(100*correct)}%, Avg loss: {test_loss}")
        acc_s.append(correct)   # 将总准确个数传入列表acc_s
        loss_s.append(test_loss)  # 键总损失值传入列表loss_s

# 保存最优模型的前2种方法，模型扩展名一般为：py\pth\t7
    if correct > bast_acc:
        bast_acc = correct

8、传入参数进行训练和测试

epochs = 80   # 模型进行80轮训练，每次训练都会更新参数的值
acc_s = []
loss_s = []
for t in range(epochs):

    print(f"Epoch {t+1}\n---------------------------")
    train(train_dataloader,model,loss_fn,optimizer)   # 传入数据进行训练
    scheduler.step()   # 每一轮过后，记录轮数，然后调整学习率
    test(test_dataloader, model, loss_fn)   # 测试
print('最优训练结果',bast_acc)   # 打印最优准确率

运行结果：

原文地址：https://blog.csdn.net/qq_64603703/article/details/142574949

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：物联网行业中心跳机制的介绍以及如何实现
下一篇：springcloud为什么采用Http而非RPC

第9章综合案例————众成远程教育
制作“众成远程教育”网页，本章项目页面布局要求如下:页面要求有最外层的 div-al，第二层嵌套上中下3行区域，分别为div-top.div-main和 div-footer。而 div-main 又
阅读更多2024-11-17
Python3语法基础（全，带示例）
信息技术类，对口高考，Python，教师：施恒锋
阅读更多2024-11-17
【鸿蒙开发】第十四章 Web组件的使用、基本属性与事件
Web组件用于在应用程序中显示Web页面内容，为开发者提供页面加载、页面交互、页面调试等能力。页面加载：Web组件提供基础的前端页面加载的能力，包括：加载网络页面、本地页面、html格式文本数据。页面
阅读更多2024-11-17
python基础知识（五）——文件上传
python基础知识（五）——文件上传
阅读更多2024-11-17
如何在uniapp中获取和修改Web项目的Cookie
在uniapp开发Web项目时，操作Cookie是常见的需求。本文将介绍如何在uniapp中获取和修改Web项目的Cookie，且不设置过期时间。
阅读更多2024-11-17
时钟之Canvas+JS版
上一篇介绍使用CSS+JS方式实现，但元素泰国单一。此篇将以HTML5的canvas标签结合JS来实现。HTML代码JS代码//计时器//钟表半径//时针刻度宽度//分针刻度宽度//时针宽度//分针宽
阅读更多2024-11-17
AI测试的主要研究方向介绍
这个框架将支持对不同主题的基础测试数据集进行文本分词、图像标注、特征筛选等加工处理，为不同AI医疗产品提供定制化的测试数据，解决医学数据模块的通用性与特定测试数据集需求之间的冲突，确保测试数据集既具有
阅读更多2024-11-17
CSS盒子的定位＞（下篇）#固定定位#笔记
固定定位其实是绝对定位的子类别，一个设置了的元素是相对于视窗固定的，就算页面文档发生了滚动，它也会一直待在相同的地方。
阅读更多2024-11-17
doris udf -- 避免使用递归CTE
在部门表里有部门id (dept_id) 和父部门id (parent_id) ，父部门id同时也是部门id。现在要查部门id下所有的子部门id，但是不知道部门层级，部门关系可能也会调整。
阅读更多2024-11-17
前端知识点---this的用法 , this动态绑定(Javascript)
在JavaScript中，this 是一个非常重要但是呢也让人难搞明白的关键字。**它的值不是在编写代码时静态确定的，而是在代码运行时动态绑定的。**这非常重要下面讲一下它 .在全局作用域中（即不在
阅读更多2024-11-17

《深度学习》迁移学习综合应用 原理、案例解析与实现

一、迁移学习

1、什么是迁移学习

2、迁移学习步骤

1）选择预训练的模型和适当的层

2）冻结预训练模型的参数

3）在新数据集上训练新增加的层

4）微调预训练模型的层

5）评估和测试

二、案例实现

1、数据准备及目的

2、冻结参数、更改输出特征

3、数据增强处理

4、导入图像并打包

1）文件内容

2）代码部分

5、损失函数、优化器、调整学习率

6、定义训练集

7、定义测试集

8、传入参数进行训练和测试

运行结果：

相关文章

《深度学习》迁移学习综合应用原理、案例解析与实现