自学内容网 自学内容网

【PyTorch】图像多分类项目部署

【PyTorch】图像多分类项目

【PyTorch】图像多分类项目部署

如果需要在独立于训练脚本的新脚本中部署模型,这种情况模型和权重在内存中不存在,因此需要构造一个模型类的对象,然后将存储的权重加载到模型中。

加载模型参数,验证模型的性能,并在测试数据集上部署模型

from torch import nn
from torchvision import models

# 定义一个resnet18模型,不使用预训练参数
model_resnet18 = models.resnet18(pretrained=False)
# 获取模型的全连接层的输入特征数
num_ftrs = model_resnet18.fc.in_features
# 定义分类的类别数
num_classes=10
# 将全连接层的输出特征数改为分类的类别数
model_resnet18.fc = nn.Linear(num_ftrs, num_classes)

import torch 
path2weights="./models/resnet18_pretrained.pt"
# 加载预训练的ResNet18模型权重
model_resnet18.load_state_dict(torch.load(path2weights))
# 将ResNet-18模型设置为评估模式
model_resnet18.eval();
# 检查CUDA是否可用
if torch.cuda.is_available():
    # 如果可用,将设备设置为CUDA
    device = torch.device("cuda")
    # 将模型移动到CUDA设备上
    model_resnet18=model_resnet18.to(device)

def deploy_model(model,dataset,device, num_classes=10,sanity_check=False):

    # 获取数据集的长度
    len_data=len(dataset)
    
    # 初始化输出张量
    y_out=torch.zeros(len_data,num_classes)
    
    # 初始化真实标签张量
    y_gt=np.zeros((len_data),dtype="uint8")
    
    # 将模型移动到指定设备
    model=model.to(device)
    
    # 初始化时间列表
    elapsed_times=[]
    with torch.no_grad():
        for i in range(len_data):
            # 获取数据集中的一个样本
            x,y=dataset[i]
            # 将真实标签存入张量
            y_gt[i]=y
            # 记录开始时间
            start=time.time()    
            # 将输入数据传入模型进行预测
            yy=model(x.unsqueeze(0).to(device))
            # 将预测结果存入张量
            y_out[i]=torch.softmax(yy,dim=1)
            # 计算预测时间
            elapsed=time.time()-start
            # 将预测时间存入列表
            elapsed_times.append(elapsed)

            # 如果进行完整性检查,则跳出循环
            if sanity_check is True:
                break

    # 计算平均预测时间
    inference_time=np.mean(elapsed_times)*1000
    # 打印平均预测时间
    print("average inference time per image on %s: %.2f ms " %(device,inference_time))
    # 返回预测结果和真实标签
    return y_out.numpy(),y_gt
from torchvision import datasets
import torchvision.transforms as transforms

# 数据转换
data_transformer = transforms.Compose([transforms.ToTensor()])

path2data="./data"

# 加载数据
test0_ds=datasets.STL10(path2data, split='test', download=True,transform=data_transformer)
print(test0_ds.data.shape)

from sklearn.model_selection import StratifiedShuffleSplit

# 创建StratifiedShuffleSplit对象,设置分割次数为1,测试集大小为0.2,随机种子为0
sss = StratifiedShuffleSplit(n_splits=1, test_size=0.2, random_state=0)

# 获取test0_ds的索引
indices=list(range(len(test0_ds)))

# 获取test0_ds的标签
y_test0=[y for _,y in test0_ds]

# 对索引和标签进行分割
for test_index, val_index in sss.split(indices, y_test0):
    # 打印测试集和验证集的索引
    print("test:", test_index, "val:", val_index)
    # 打印测试集和验证集的大小
    print(len(val_index),len(test_index))

from torch.utils.data import Subset

# 从test0_ds中选取val_index索引的子集,赋值给val_ds
val_ds=Subset(test0_ds,val_index)
# 从test0_ds中选取test_index索引的子集,赋值给test_ds
test_ds=Subset(test0_ds,test_index)
# 定义均值
mean=[0.4467106, 0.43980986, 0.40664646]
# 定义标准差
std=[0.22414584,0.22148906,0.22389975]
# 定义一个名为test0_transformer的变量,用于将一系列的图像变换操作组合在一起
test0_transformer = transforms.Compose([
    # 将图像转换为Tensor类型
    transforms.ToTensor(),
    # 对图像进行归一化操作,使用mean和std作为均值和标准差
    transforms.Normalize(mean, std),
    ])   
# 将test0_transformer赋值给test0_ds的transform属性
test0_ds.transform=test0_transformer
import time
import numpy as np

# 调用deploy_model函数,传入model_resnet18,val_ds,device和sanity_check参数,返回y_out和y_gt
y_out,y_gt=deploy_model(model_resnet18,val_ds,device=device,sanity_check=False)
# 打印y_out和y_gt的形状
print(y_out.shape,y_gt.shape)

from sklearn.metrics import accuracy_score

# 将y_out中的最大值索引赋值给y_pred
y_pred = np.argmax(y_out,axis=1)
# 打印y_pred和y_gt的形状
print(y_pred.shape,y_gt.shape)

# 计算并打印y_pred和y_gt的准确率
acc=accuracy_score(y_pred,y_gt)
print("accuracy: %.2f" %acc)

 

# 部署模型,得到预测结果和真实标签
y_out,y_gt=deploy_model(model_resnet18,test_ds,device=device)

# 取出预测结果中概率最大的类别
y_pred = np.argmax(y_out,axis=1)

# 计算准确率
acc=accuracy_score(y_pred,y_gt)

# 打印准确率
print(acc)

from torchvision import utils
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline
np.random.seed(1)

# 定义一个函数,用于显示图像
def imshow(inp, title=None):
    # 定义图像的均值和标准差
    mean=[0.4467106, 0.43980986, 0.40664646]
    std=[0.22414584,0.22148906,0.22389975]
    # 将图像从tensor转换为numpy数组,并转置
    inp = inp.numpy().transpose((1, 2, 0))
    # 将均值和标准差转换为numpy数组
    mean = np.array(mean)
    std = np.array(std)
    # 将图像的像素值进行归一化
    inp = std * inp + mean
    # 将像素值限制在0和1之间
    inp = np.clip(inp, 0, 1)
    # 显示图像
    plt.imshow(inp)
    # 如果有标题,则显示标题
    if title is not None:
        plt.title(title)
    # 暂停0.001秒
    plt.pause(0.001) 

# 定义网格大小
grid_size=16
# 随机生成4个索引
rnd_inds=np.random.randint(1,len(test_ds),grid_size)
# 打印随机生成的索引
print("image indices:",rnd_inds)

# 根据索引获取对应的图像和标签
x_grid_test=[test_ds[i][0] for i in rnd_inds]
y_grid_test=[(y_pred[i],y_gt[i]) for i in rnd_inds]

# 将图像转换为网格
x_grid_test=utils.make_grid(x_grid_test, nrow=4, padding=2)
# 打印网格的形状
print(x_grid_test.shape)

# 设置图像的大小
plt.rcParams['figure.figsize'] = (10, 10)
# 显示网格
imshow(x_grid_test,y_grid_test)


原文地址:https://blog.csdn.net/weixin_73404807/article/details/140592574

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!