003_动手实现MLP(详细版)

🕗 发布于 2024-09-24 20:04 深度学习 人工智能 神经网络 python

常见的激活的有：RELU,sigmoid,tanh
代码

import torch
import numpy as np
import sys
import d2lzh_pytorch as d2l
import torchvision
from torchvision import transforms
# 1.数据预处理
mnist_train = torchvision.datasets.FashionMNIST(
   root='/Users/wPycharmProjects/DeepLearning_with_LiMu/datasets/FashionMnist', train=True, download=True,
   transform=transforms.ToTensor())
mnist_test = torchvision.datasets.FashionMNIST(
   root='/Users/w/PycharmProjects/DeepLearning_with_LiMu/datasets/FashionMnist', train=False, download=True,
   transform=transforms.ToTensor())
# 1.2 数据集的预处理
batch_size = 256
if sys.platform.startswith('win'):
   num_worker = 0
else:
   num_worker = 4
train_iter = torch.utils.data.DataLoader(mnist_train, batch_size=batch_size, shuffle=True, num_workers=num_worker)
test_iter  = torch.utils.data.DataLoader(mnist_test, batch_size=batch_size, shuffle=False, num_workers=num_worker)


num_inputs, num_outputs, num_hiddens = 784, 10, 256
W1 = torch.tensor(np.random.normal(0, 0.01, (num_inputs, num_hiddens)), dtype=torch.float32)
b1 = torch.zeros(num_hiddens, dtype=torch.float)
W2 = torch.tensor(np.random.normal(0, 0.01, (num_hiddens, num_outputs)), dtype=torch.float32)
b2 = torch.zeros(num_outputs, dtype=torch.float)
params = [W1,W2,b1,b2]
for param in params:
   param.requires_grad_(requires_grad = True)

# 自定义Relu函数
def relu(X):
   return  torch.max(input=X, other=torch.tensor(0.0))
def net(X):
   X = X.view((-1,num_inputs))
   H = relu(torch.matmul(X,W1)+b1)
   return torch.matmul(H,W2)+b2
#损失函数使用交叉熵损失函数
loss = torch.nn.CrossEntropyLoss()

# 4.定义模型评估
# 4.1 定义已知结果下模型评估
def accuracy(y_hat,y):
   return (y_hat.argmax(dim=1)==y).float().mean().item()
# t1 = torch.tensor([[1,2,3,4,5]])
# t2 = torch.tensor([1,2,3,4,6])
# ratio = accuracy(y_hat=t1,y = t2)
# print('测试精度函数：' + str(accuracy(t1,t2)) )
# 4.2 定义模型对，测试数据集的准确率
def evaluate_accuracy(data_iter,net):
   acc_sum,n = 0.0,0
   for X,y in data_iter:
       acc_sum +=  (net(X).argmax(dim=1)==y).float().sum().item()
       n+=y.shape[0]
   return acc_sum/n

# 测试evaluate_accuracy函数
evaluate_accuracy(test_iter,net)




def sgd(params, lr, batch_size):
   """Minibatch stochastic gradient descent.

   Defined in :numref:`sec_linear_scratch`"""
   with torch.no_grad():
       for param in params:
           param -= lr * param.grad / batch_size
           param.grad.zero_()
num_epochs, lr = 5, 0.1
def train_mlp(net, train_iter, test_iter, loss, num_epochs, batch_size,
             params=None, lr=None, optimizer=None):
   for epoch in range(num_epochs):
       train_l_sum, train_acc_sum, n = 0.0, 0.0, 0
       for X, y in train_iter:
           y_hat = net(X)
           l = loss(y_hat, y).sum()

           # 梯度清零
           if optimizer is not None:
               optimizer.zero_grad()
           elif params is not None and params[0].grad is not None:
               for param in params:
                   param.grad.data.zero_()

           l.backward()
           if optimizer is None:
               sgd(params, lr, batch_size)
           else:
               optimizer.step()  # “softmax回归的简洁实现”一节将用到


           train_l_sum += l.item()
           train_acc_sum += (y_hat.argmax(dim=1) == y).sum().item()
           n += y.shape[0]
       test_acc = evaluate_accuracy(test_iter, net)
       print('epoch %d, loss %.4f, train acc %.3f, test acc %.3f'
             % (epoch + 1, train_l_sum / n, train_acc_sum / n, test_acc))




train_mlp(net, train_iter, test_iter, loss, num_epochs, batch_size, params, lr)

在这里插入图片描述

原文地址：https://blog.csdn.net/u013521296/article/details/142486550

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Leetcode 螺旋矩阵
下一篇：oracle生成随机数

PHP 中，将 JSON 数据与二进制数据之间进行相互转化主要涉及两个步骤：
要将 JSON 数据转换为二进制数据，首先需要将 JSON 数据解析成 PHP 数组或对象，然后使用 PHP 的。函数将二进制字符串转换为 PHP 数组或对象，然后将其编码为 JSON 数据。如果你只
阅读更多2024-09-28
JavaEE: 探索网络世界的核心-IP协议
13位分片偏移: 是分片相对于原始IP报文开始处的偏移.其实就是在表示当前分片在原报文中处在哪个位置.实际偏移的字节数是这个值 * 8 得到的.因此,除了最后一个报文之外,其他报文的长度必须是8的整数
阅读更多2024-09-28
数据库常见概念
PostgreSQL 支持联合索引和聚簇索引，联合索引可以加速多列条件的查询，而聚簇索引控制数据在磁盘上的排列。适当地使用这些索引可以提高查询性能。
阅读更多2024-09-28
BEV学习---LSS4-模型训练
LSS训练测试
阅读更多2024-09-28
SpringCloud第六章(服务保护CircuitBreaker) -2024
CircuitBreaker是断路器的意思，由于原来的SpringCoud的hystrix停更，所以springcloud社区推出了的新断路器，用来进行springcloud的服务降级、限流、熔断由于
阅读更多2024-09-28
ubuntu 开启root
【代码】ubuntu 开启root。
阅读更多2024-09-28
MySQL数据查询（基础）
SELECT语句用于从表中查询数据。可以选择特定的列，也可以选择所有列。：使用表示选择所有列。
阅读更多2024-09-28
区块链可投会议CCF C--FC 2025 截止10.8 附录用率
CCF C：2025：2023年 39 full and 2 short papers selected from 182 submissions.
阅读更多2024-09-28
第1章 C语言概述
4.打开项目后，右击"源文件"并选择"添加"的"新建项"6.在"hello_word"文件下编写代码并点击运行。1.打开
阅读更多2024-09-28
Git 与 GUI 工具
当我们对 Git 的提交、分支已经非常熟悉，可以熟练使用命令操作 Git 后，再使用 GUI 工具，就可以更高效。
阅读更多2024-09-28

003_动手实现MLP(详细版)

相关文章