softmax从零开始实现

🕗 发布于 2024-07-03 21:36 python 深度学习 pytorch 人工智能

softmax从零开始实现

代码
结果

代码

import numpy as np
import torch
import torchvision
import torchvision.transforms as transforms
from torch.utils import data

# H,W,C -> C,H,W
mnist_train = torchvision.datasets.FashionMNIST(root="./data", train=True, download=True,
                                                transform=transforms.ToTensor())
mnist_test = torchvision.datasets.FashionMNIST(root="./data", train=False, download=True,
                                               transform=transforms.ToTensor())
batch_size = 256
# 随机读取⼩批量
train_loader = data.DataLoader(mnist_train, batch_size, shuffle=True)
test_loader = data.DataLoader(mnist_test, batch_size, shuffle=True)

# feature, label = mnist_train[0]
# print(feature.shape, label) # torch.Size([1, 28, 28]) 9

num_inputs = 784
num_outputs = 10


def softmax(X):
    X_exp = X.exp()
    partition = X_exp.sum(dim=1, keepdim=True)  # 按行
    return X_exp / partition  # 这⾥应⽤了⼴播机制


def net(X):
    return softmax(torch.mm(X.view((-1, num_inputs)), W) + b)


def cross_entropy(y_hat, y):
    return - torch.log(y_hat.gather(1, y.view(-1, 1)))


def sgd(params, lr, batch_size):
    for param in params:
        param.data -= lr * param.grad / batch_size  # 注意这⾥更改param时⽤的param.data


def accuracy(y_hat, y):
    return (y_hat.argmax(dim=1) == y).float().mean().item()

W = torch.tensor(np.random.normal(0, 0.01, (num_inputs, num_outputs)), dtype=torch.float)
b = torch.zeros(num_outputs, dtype=torch.float)
W.requires_grad_()
b.requires_grad_()

num_epochs, lr = 10, 0.1
loss = cross_entropy
optimizer = sgd
for epoch in range(1, 1 + num_epochs):
    total_loss = 0.0
    train_sample = 0.0
    train_acc_sum = 0
    for x, y in train_loader:
        y_hat = net(x)
        l = loss(y_hat, y) # 256,1
        # 梯度清零
        l.sum().backward()
        sgd([W, b], lr, batch_size)  # 使用参数的梯度更新参数

        W.grad.data.zero_()
        b.grad.data.zero_()

        total_loss += l.sum().item()
        train_sample += y.shape[0]
        train_acc_sum += (y_hat.argmax(dim=1) == y).sum().item()

    print('epoch %d, loss %.4f, train acc %.3f' % (epoch, total_loss / train_sample, train_acc_sum / train_sample,))

with torch.no_grad():
    total_loss = 0.0
    test_sample = 0.0
    test_acc_sum = 0
    for x, y in test_loader:
        y_hat = net(x)
        l = loss(y_hat, y)  # 256,1

        total_loss += l.sum().item()
        test_sample += y.shape[0]
        test_acc_sum += (y_hat.argmax(dim=1) == y).sum().item()
    print('loss %.4f, test acc %.3f' % (total_loss / test_sample, test_acc_sum / test_sample,))

结果

在这里插入图片描述

原文地址：https://blog.csdn.net/weixin_45920385/article/details/140157697

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【大模型LLM面试合集】大语言模型基础_llm概念
下一篇：声音音频文件波谱可视化展示

数据结构——List接口
在集合框架中，List是一个接口，通过其源码，我们可以清楚看到其继承了Collection。Collection 也是一个接口，该接口中规范了后序容器中常用的一些方法，具体如下所示：Iterable也
阅读更多2024-10-06
SpringCloud-基于Docker和Docker-Compose的项目部署
本文详细介绍了如何利用Docker和Docker-Compose实现项目的高效部署。首先，初始化环境，包括卸载旧版本的Docker、更新系统和安装必要的依赖项。然后，设置国内的Docker镜像源（如腾
阅读更多2024-10-06
分布式理论：拜占庭将军问题
拜占庭将军问题是对分布式共识问题的一种情景化描述，由兰伯特于1082首次发表《The Byzantine Generals Problem》中提及，它是分布式领域最复杂的一个容错模型，它描述了如何在
阅读更多2024-10-06
visual studio2022添加新项中没有html和css
重装的vs2022，开发c#项目，但是打开发现添加新项中没有html,也没有css样式表文件
阅读更多2024-10-06
c#里氏替换
/is关键字用于检查对象实际运行时类型，虽然传递了Rectangle子类，也进行了隐式转换，但只是把他当作Shape类对象在方法里去使用，实际的对象信息并没有改变（可以理解为不在方法里了他实际还是Re
阅读更多2024-10-06
一行 Python 代码能实现什么丧心病狂的功能？圣诞树源代码
手头有 109 张头部 CT 的断层扫描图片，我打算用这些图片尝试头部的三维重建。基础工作之一，就是要把这些图片数据读出来，组织成一个三维的数据结构（实际上是四维的，因为每个像素有 RGBA 四个通道
阅读更多2024-10-06
华为OD的职级与薪资
除了月薪（base），华为 OD 也是有年终奖的，年终奖和个人绩效挂钩，绩效为 A 可以拿 4 个月年终，绩效为 B 可以拿 2 个月年终，因此华为 OD 年终奖的范围在 2~4 个月。这几年随着招聘
阅读更多2024-10-06
深度解析：Tkinter 界面布局与优化技巧
pack()grid()和place()，每一种都有其适用场景。选择合适的布局管理器是界面设计的关键步骤。pack()：组件按顺序排列，适用于简单、线性布局。grid()：基于行和列的布局管理器，适合
阅读更多2024-10-06
[单master节点k8s部署]29.Istio流量管理（五）
测试istio熔断管理。采用httpbin镜像和fortio镜像，其中httpbin作为服务端，fortio是请求端。这两个的配置yaml文件都在istio的samples/httpbin目录下，fo
阅读更多2024-10-06
在centos7.9启动docker 18.09.9报错 error initializing graphdriver: overlay2
d_type`是XFS文件系统的一个特性，它允许文件系统直接报告目录项的类型（比如普通文件、目录等），这对于Docker这样的容器运行时来说是很重要的。3. 编辑Docker配置文件（通常是`/etc
阅读更多2024-10-06

softmax从零开始实现

softmax从零开始实现

代码

结果

相关文章