002.从零开始实现softMax回归(pytorch)

🕗 发布于 2024-09-24 12:55 回归 pytorch 数据挖掘

1. 从零实现

0 导入需要的包

#000 导包
import torch
print(torch.__version__)
import torchvision
print(torchvision.__version__)
import torchvision.transforms as transforms
import d2l.torch as d2l
import numpy as np
import os
print("当前工作目录:", os.getcwd())
import sys
import torchtext
#------------运行结果---------------
# 1.12.0
# 0.13.0

1.数据的下载及预处理

#1. 数据集的下载和预处理
# 1.1 数据集合的下载
mnist_train = torchvision.datasets.FashionMNIST(
    root='/Users/w/PycharmProjects/DeepLearning_with_LiMu/datasets/FashionMnist', train=True, download=True,
    transform=transforms.ToTensor())
mnist_test = torchvision.datasets.FashionMNIST(
    root='/Users/w/PycharmProjects/DeepLearning_with_LiMu/datasets/FashionMnist', train=False, download=True,
    transform=transforms.ToTensor())
# 1.2 数据集的预处理
batch_size = 256
if sys.platform.startswith('win'):
    num_worker = 0
else:
    num_worker = 4
train_iter = torch.utils.data.DataLoader(mnist_train, batch_size=batch_size, shuffle=True, num_workers=num_worker)
test_iter  = torch.utils.data.DataLoader(mnist_test, batch_size=batch_size, shuffle=False, num_workers=num_worker)
#1.3 数据详情与分析
    # <class 'torchvision.datasets.mnist.FashionMNIST'>
print(type(mnist_train))
    # 60000 10000  训练集的数量6W条，测试集的数量1W条
print(len(mnist_train), len(mnist_test))
    # 绘制图像直观展示，原始数据
from CommonFunctionModule import data_iter
from CommonFunctionModule import get_fashion_mnist_label
from CommonFunctionModule import show_fashion_mnist
X, y = [], []
for i in range(10):
    X.append(mnist_train[i][0])
    y.append(mnist_train[i][1])
show_fashion_mnist(X, get_fashion_mnist_label(y))
feature, label = mnist_train[0]
print('feature.size() = ' + str(feature.size())  +'\n')
feature_trans = feature.reshape((-1,28*28))
print('feature_trans.size()' +str(feature_trans.size())  +'\n' )

<class ‘torchvision.datasets.mnist.FashionMNIST’>
60000 10000
在这里插入图片描述

2.定义模型

# 2.定义模型
## 2.1 参数初始化
    # 输入神经元的个数
num_input = 28 * 28
    # 输出神经元的个数
num_output = 10
    # 参数初始化， 样本矩阵： n*784  权重矩阵：784*10   X·w = n*10
w = torch.tensor(np.random.normal(loc=0, scale=0.01, size=(num_input, num_output)), dtype=torch.float32,requires_grad=True)
b = torch.zeros(num_output,dtype = torch.float32,requires_grad=True)
def net(X):
    return softmax(torch.mm(X.view((-1, num_input)), w) + b)
def softmax(X):
    X_exp = X.exp()
    X_sum = X_exp.sum(dim=1, keepdim=True)
    return X_exp / X_sum

3.定义损失函数

# 3.定义损失函数，使用交叉熵损失函数
def cross_entropy(y_hat,y):
    return - torch.log( y_hat.gather(dim = 1, index= y.view(-1,1)))

4.定义模型评估函数

# 4.定义模型评估
# 4.1 定义已知结果下模型评估
def accuracy(y_hat,y):
    return (y_hat.argmax(dim=1)==y).float().mean().item()
# t1 = torch.tensor([[1,2,3,4,5]])
# t2 = torch.tensor([1,2,3,4,6])
# ratio = accuracy(y_hat=t1,y = t2)
# print('测试精度函数：' + str(accuracy(t1,t2)) )
# 4.2 定义模型对，测试数据集的准确率
def evaluate_accuracy(data_iter,net):
    acc_sum,n = 0.0,0
    for X,y in data_iter:
        acc_sum +=  (net(X).argmax(dim=1)==y).float().sum().item()
        n+=y.shape[0]
    return acc_sum/n

# 测试evaluate_accuracy函数
evaluate_accuracy(test_iter,net)

5.模型训练

# 5.模型训练
num_epochs,lr =5,0.1
def train_fashion_mnist(net , train_iter , test_iter , loss ,num_epochs ,batch_size,params =None,lr =None, optimizer= None):
    for epoch in range(num_epochs):
        train_l_sum, train_acc_sum ,n = 0.0,0.0,0
        for X,y in train_iter:
            # 正向传播
            y_hat = net(X)
            # 计算损失函数
            l = loss(y_hat,y).sum()
            # 梯度清零
            if optimizer is not None:
                optimizer.zero_grad()
            elif  params is not None and params[0].grad is not None:
                for param in params:
                    param.grad.data.zero_()
            l.backward()
            if  optimizer is None:
                d2l.sgd(params,lr, batch_size)
            else:
                optimizer.step()
            # 累加求本轮损失综合
            train_l_sum += l.item()
            # 累加求精度总和
            train_acc_sum +=(y_hat.argmax(dim= 1) ==y).sum().item()
            # 计数
            n += y.shape[0]
        test_acc  =  evaluate_accuracy(test_iter,net)
        print('epoch %d ,loss %.4f , train acc %.3f ,test acc %.3f' % (epoch+1,train_l_sum/n,train_acc_sum/n,test_acc))
train_fashion_mnist(net,train_iter,test_iter,cross_entropy,5,batch_size,[w,b],lr)

epoch 1 ,loss 0.7869 , train acc 0.748 ,test acc 0.794
epoch 2 ,loss 0.5697 , train acc 0.813 ,test acc 0.805
epoch 3 ,loss 0.5254 , train acc 0.825 ,test acc 0.818
epoch 4 ,loss 0.5018 , train acc 0.831 ,test acc 0.825
epoch 5 ,loss 0.4852 , train acc 0.838 ,test acc 0.827

6.模型的预测结果及可视化

X,y = iter(test_iter).next()
true_labels = d2l.get_fashion_mnist_labels(y.numpy())
pred_labels = d2l.get_fashion_mnist_labels(net(X).argmax(dim=1).numpy())
import d2lzh_pytorch as d2l
titles = [true+'\n'+pred for true,pred in zip(true_labels,pred_labels)]
d2l.show_fashion_mnist(X[0:9],titles[0:9])

在这里插入图片描述

原文地址：https://blog.csdn.net/u013521296/article/details/142480103

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：量子计算Quantum Computing
下一篇：Avalonia第三方UI库Semi.Avalonia用法详解

python自动化接口测试
前情阅读，关于自动化接口测试的基础知识介绍，可以阅读如下文章。
阅读更多2024-09-24
vue3＜script setup＞中使用reactive包裹的对象被重新赋值失去响应式原因和解决方式
Object.assign() 方法用于将所有可枚举属性的值从一个或多个源对象复制到目标对象，它会返回目标对象。
阅读更多2024-09-24
数位dp，LeetCode 2376 统计特殊整数
数位dp如何递推求解？
阅读更多2024-09-24
C#开发记录如何建立虚拟串口，进行串口通信，以及通信模板
记录时间;2024年4月记录如何开启虚拟串口以及进行基础串口通信。
阅读更多2024-09-24
【C++掌中宝】深入理解函数重载：概念、规则与应用
函数重载的概念，规则与应用的相关知识分享
阅读更多2024-09-24
[Matplotlib 教程] 如何用3D折线图直观展示多维数据变化
在数据分析中，我们经常需要展示多个维度的数据变化。最近，我用Python的Matplotlib库绘制了一个非常直观的3D折线图，展示了不同维度的数据随时间的变化。这种图不仅能应用在深度学习模型的训练中
阅读更多2024-09-24
解决银河麒麟桌面操作系统V10SP1 SSH连接“connection reset by ip地址 port 22”问题
遇到SSH连接银河麒麟V10SP1时“connection reset by ip地址 port 22”的错误，可以尝试以下步骤解决：
阅读更多2024-09-24
面经 | css
flex:1是felx:1 1 0的简写，是flex-grow:1;flex-basis:0的简写；掌握熟悉上面的一两种写下就行了。父元素是非static元素。
阅读更多2024-09-24
乐鑫ESP8266/安信可 ESP-01sWiFi模块烧录MQTT AT固件
ESP8266/ESP-01s烧录MQTT AT烧录最新的MQTT AT固件到ESP8266-01s模块的原因是，这一固件版本提供了对MQTT协议的原生支持，这使得模块能够直接作为MQTT客户端进行操
阅读更多2024-09-24
C语言 | Leetcode C语言题解之第430题扁平化多级双向链表
C语言 | Leetcode C语言题解之第430题扁平化多级双向链表
阅读更多2024-09-24