【动手学深度学习Pytorch】1. 线性回归代码

🕗 发布于 2024-11-18 18:03 深度学习 pytorch 线性回归

零实现

导入所需要的包：

# %matplotlib inline
import random
import torch
from d2l import torch as d2l
import matplotlib.pyplot as plt
import matplotlib
import os

构造人造数据集：假设w=[2, -3.4]，b=4.2，存在随机噪音（均值为0，方差为0.001的正态分布噪声），函数拟合为 $y = w^{T}X + b + n$ 。在构造数据集的过程中，首先X为正态分布（均值为0，方差为1，样本数/行数为num_examples，列数为len(w)）

torch.normal(mean, std, *, generator=None, out=None)：生成指定输出尺寸的正态分布随机数张量

torch.mv()：矩阵和向量的乘积，此处X为矩阵，w为向量

def synthetic_data(w, b, num_examples):
    X = torch.normal(0, 1, (num_examples, len(w))) #均值为0方差为1的随机数,样本数,列数
    y = torch.mv(X, w) + b #y关于x的公式
    y += torch.normal(0, 0.001, y.shape) # 加入噪声项
    return X, y.reshape((-1,1)) #做成列向量返回
true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = synthetic_data(true_w, true_b, 1000)

查看数据集样本分布：

matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, *, edgecolors=None, plotnonfinite=False, data=None, **kwargs):

        x，y：长度相同的数组，也就是我们即将绘制散点图的数据点，输入数据。

        s：点的大小，默认 20，也可以是个数组，数组每个参数为对应点的大小。

        c：点的颜色，默认蓝色 'b'，也可以是个 RGB 或 RGBA 二维行数组。

        marker：点的样式，默认小圆圈 'o'。

        cmap：Colormap，默认 None，标量或者是一个 colormap 的名字，只有 c 是一个浮点数数组的时才使用。如果没有申明就是 image.cmap。

        norm：Normalize，默认 None，数据亮度在 0-1 之间，只有 c 是一个浮点数的数组的时才使用。

        vmin，vmax：亮度设置，在 norm 参数存在时会忽略。

        alpha：透明度设置，0-1 之间，默认 None，即不透明。

        linewidths：标记点的长度。

        edgecolors：颜色或颜色序列，默认为 'face'，可选值有 'face', 'none', None。

        plotnonfinite：布尔值，设置是否使用非限定的 c ( inf, -inf 或 nan) 绘制点。

        **kwargs：其他参数。

detach()：允许我们从计算图中分离出张量。当对一个张量调用detach()方法时，它会创建一个新的张量，这个新张量与原始张量共享数据，但它不再参与计算图的任何操作，对分离后的张量进行的任何操作都不会影响原始张量，也不会在计算图中留下任何痕迹。

plt.scatter(features[:,(1)].detach().numpy(),labels.detach().numpy(),1);
plt.show()

遍历数据集，输出数据集内容：

len(): 返回对象（字符、列表、元组等）长度或项目个数（此处是张量的行数）

list(): 将元组转换为列表

range()：创建一个整数列表

shuffle(): 随机打乱列表

def data_iter(batch_size, features, labels):
    num_examples = len(features)
    indices = list(range(num_examples)) #生成样本索引
    random.shuffle(indices) #样本随机读取没有特定顺序
    # 进行batch划分
    for i in range(0, num_examples, batch_size): #从i开始到i+batchsize
        batch_indices =  torch.tensor(indices[i:min(i + batch_size, num_examples)])
        # 截取切片：开始位置为i，结束位置为min函数的返回值
        # 返回值为i+batch_size和num_examples的值比较小的那个
        yield features[batch_indices], labels[batch_indices] #产生随机顺序的特征&标号

batch_size = 10

for X, y in data_iter(batch_size, features, labels):
    print(X, '\n', y)
    break

定义参数、模型、损失函数以及优化算法：

torch.mutual()：矩阵相乘

with torch.no_grad()：所有计算得出的tensor的requires_grad都自动设置为False，不会进行自动求导

grad.zero_()：将梯度置零（不然会发生累计的情况）

# 定义初始化模型参数
w = torch.normal(0, 0.01, size=(2,1), requires_grad=True)
b = torch.zeros(1, requires_grad=True)
# 定义模型
def linreg(X, w, b):
    return torch.matmul(X, w) + b
# 定义损失函数
def squared_loss(y_hat, y):
    return (y_hat - y.reshape(y_hat.shape))**2/2
# 定义优化算法
def sgd(params, lr, batch_size):
    with torch.no_grad():
        for param in params:
            param -= lr * param.grad / batch_size
            param.grad.zero_()

定义训练过程：

# 训练过程
lr = 0.01
num_epochs = 10
net = linreg
loss = squared_loss

for epoch in range(num_epochs):
    for X, y in data_iter(batch_size, features, labels):
        l = loss(net(X, w, b), y)
        l.sum().backward()
        sgd([w,b], lr, batch_size)
    with torch.no_grad():
        train_1= loss(net(features, w, b), labels)
        print(f'epoch{epoch + 1}, loss{float(train_1.mean()):f}')

简介实现

导入所需要的包：

import numpy as np
import torch
from torch.utils import data
from d2l import torch as d2l
import matplotlib.pyplot as plt

创建人造数据集：

data.TensorDataset()：将数据进行封装

data.DataLoader()：将数据分批次处理

iter()：获取列表的迭代器

next()：获取下一个值

true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = d2l.synthetic_data(true_w, true_b,1000)
def load_array(data_arrays, batch_size, is_train=True):
    dataset = data.TensorDataset(*data_arrays)
    return data.DataLoader(dataset, batch_size, shuffle=is_train)

batch_size = 10
data_iter = load_array((features, labels), batch_size)

next(iter(data_iter))

初始化模型、模型参数、loss：

nn.Sequential()：实现模型层结构的简单排序

torch.optim.SGD()：定义优化算法

torch.optim.SGD().step()：进行模型的更新

# 使用框架的预定义好的层
from torch import nn
net = nn.Sequential(nn.Linear(2,1))
# 初始化模型参数
net[0].weight.data.normal_(0, 0.01)
net[0].bias.data.fill_(0)
# 计算均方误差使用的是MSELoss类
loss = nn.MSELoss()
trainer = torch.optim.SGD(net.parameters(),lr=0.01)

定义训练过程：

num_epochs = 3
for epoch in range(num_epochs):
    for X, y in data_iter:
        l = loss(net(X), y)
        trainer.zero_grad()
        l.backward()
        trainer.step()
    l = loss(net(features), labels)
    print(f'epoch{epoch + 1}, loss{1:f}')

原文地址：https://blog.csdn.net/weixin_62403234/article/details/143807675

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：分布式系统学习笔记
下一篇：7.揭秘C语言输入输出内幕：printf与scanf的深度剖析

网络中的数据传输格式
这里划分为四层来看主机A向主机B发送数据的前提：主机A知道主机B的IP地址。
阅读更多2024-11-21
基于YOLOv8深度学习的扰乱公共秩序打架异常行为检测系统研究与实现(PyQt5界面+数据集+训练代码)
随着智能监控技术和人工智能的发展，基于深度学习的行为检测技术在公共安全和防范领域中发挥着越来越重要的作用。传统的监控系统通常依赖于人工监控，这不仅耗费大量的人力和时间，且容易因为人的疲劳或疏忽而漏检关
阅读更多2024-11-21
【网络】网络抓包与协议分析
通过网络抓包来查看各种协议，并分析各种协议的功能
阅读更多2024-11-21
np.matmul和np.dot和@有什么区别与联系
，因为这两个函数/运算符主要设计用于矩阵乘法。运算符需要将数组转换为二维形式（例如，通过。可以直接处理一维数组的点积。注意：对于一维数组的点积，
阅读更多2024-11-21
代码随想录算法训练营第二十一天 | 93.复原IP地址 | 78.子集
自己实现中遇到哪些困难一句话讲明白问题分类组合问题和分割问题都是收集树的叶子节点子集问题是找树的所有节点！切割字符串问题回顾昨天的切割回文子串，和今天的切割ip地址，都是需要将字符串拆分成 n 份。只
阅读更多2024-11-21
理解加密：常见算法及其应用
加密技术在现代信息安全中扮演着重要角色。对称加密和非对称加密各有优缺点，适用于不同的场景，而哈希算法则主要用于确保数据的完整性。在选择加密算法时，应考虑安全性、性能和数据的性质。
阅读更多2024-11-21
40分钟学 Go 语言高并发：Go语言核心回顾
这些核心概念的深入理解对于编写高质量的Go代码至关重要。建议通过实践和不断重构来加深对这些概念的理解。在后续的高并发编程中，这些基础知识将会反复用到。
阅读更多2024-11-21
python获取本地电脑的ip和mac地址
获取 IP 地址在 Python 中，可以使用socket模块来获取本地 IP 地址。以下是一个简单的示例代码：登录后复制 import socketdef get_local_ip():
阅读更多2024-11-21
VideoCrafter模型部署教程
VideoCrafter是一个功能强大的AI视频编辑和生成工具，它结合了深度学习和机器学习技术，为用户提供了便捷的视频制作和编辑体验。本文详细介绍了如何实现该模型的本地部署使用。
阅读更多2024-11-21
浪潮云启操作系统（InLinux） bcache宕机问题分析
本文以一次真实的内核宕机问题为切入点，结合实际操作案例，详细展示了如何利用工具 `crash`对内核转储（kdump）进行深入分析和调试的方法。通过对崩溃日志的解读、函数调用栈的梳理、关键地址的定位以
阅读更多2024-11-21

【动手学深度学习Pytorch】1. 线性回归代码

零实现

简介实现

相关文章