11.25Pytorch_手动构建模型实战

🕗 发布于 2024-11-26 06:31 pytorch 人工智能 python

八、手动构建模型实战

我们来整一个小小的案例，帮助加深对知识点的理解~

0. 模型训练基础概念

在进行模型训练时，有三个基础的概念我们需要颗粒度对齐下：

名词	定义
Epoch	使用训练集的全部数据对模型进行一次完整训练，被称为“一代训练”
Batch	使用训练集中的一小部分样本对模型权重进行一次反向传播的参数更新，这一小部分样本被称为“一批数据”
Iteration	使用一个Batch数据对模型进行一次参数更新的过程，被称为“一次训练”

1. 数据处理这里简单的构建一批数据集

1.1 构建数据集

代码参考如下：

import math
import random
import torch
import numpy as np
from sklearn.datasets import make_regression
import pandas as pd


def build_dataset():
    """
    使用 sklearn 的 make_regression 方法来构建一个模拟的回归数据集。

    make_regression 方法的参数解释:
    - n_samples: 生成的样本数量，决定了数据集的规模。
    - n_features: 生成的特征数量，决定了数据维度。
    - noise: 添加到目标变量的噪声标准差，用于模拟真实世界数据的不完美。
    - coef: 如果为 True, 会返回生成数据的真实系数，用于了解特征与目标变量间的真实关系。
    - random_state: 随机数生成的种子，确保在多次运行中能够复现相同的结果。

    返回:
    - X: 生成的特征矩阵。
    - y: 生成的目标变量。
    - coef: 如果在调用时 coef 参数为 True，则还会返回真实系数。
    """
    noise = random.randint(1, 5)
    X, y, coef = make_regression(
        n_samples=1000, n_features=5, bias=14.5, noise=noise, coef=True, random_state=0
    )
    # 数据转换为张量
    X = torch.tensor(X, dtype=torch.float32)
    y = torch.tensor(y, dtype=torch.float32)
    coef = torch.tensor(coef, dtype=torch.float32)

    return X, y, coef

if __name__ == "__main__":
    # 构建一批数据集
    X, y, coef = build_dataset()

    # 将特征数据X转换为DataFrame，并添加列名
    feature_names = [f"feature_{i+1}" for i in range(X.shape[1])]
    X_df = pd.DataFrame(X, columns=feature_names)

    # 创建包含目标变量y的Series
    y_series = pd.Series(y, name="Target")

    # 将特征和目标变量数据合并为一个完整的数据集
    data_df = pd.concat([X_df, y_series], axis=1)

    # 显示前20行数据
    print("前5行数据:")
    print(data_df.head())

    # 输出生成数据的真实系数
    print("\n生成数据的真实系数:")
    print(coef)

数据集结果：

前5行数据:
   feature_1  feature_2  feature_3  feature_4  feature_5      Target
0  -1.718650   0.969624   0.196770   0.143464  -1.056957   -6.838571
1  -0.998192  -1.004323  -0.766705  -1.067742  -1.373043 -198.812241
2  -1.652804   0.174680  -1.400256   0.063896   1.065927  -25.560152
3  -0.422315   0.892474   0.555963   0.228053   0.104714   73.847435
4  -1.023173   0.177158   0.976382  -0.911881   0.106720  -61.363613

生成数据的真实系数:
tensor([41.2059, 66.4995, 10.7145, 60.1951, 25.9615])

1.2 构建数据加载器

数据需要分批次加载到模型进行训练

import math
import random
import torch
import numpy as np
from sklearn.datasets import make_regression
import pandas as pd


def build_dataset():
    """
    使用 sklearn 的 make_regression 方法来构建一个模拟的回归数据集。

    make_regression 方法的参数解释:
    - n_samples: 生成的样本数量，决定了数据集的规模。
    - n_features: 生成的特征数量，决定了数据维度。
    - noise: 添加到目标变量的噪声标准差，用于模拟真实世界数据的不完美。
    - coef: 如果为 True, 会返回生成数据的真实系数，用于了解特征与目标变量间的真实关系。
    - random_state: 随机数生成的种子，确保在多次运行中能够复现相同的结果。

    返回:
    - X: 生成的特征矩阵。
    - y: 生成的目标变量。
    - coef: 如果在调用时 coef 参数为 True，则还会返回真实系数。
    """
    noise = random.randint(1, 5)
    X, y, coef = make_regression(
        n_samples=1000, n_features=5, bias=14.5, noise=noise, coef=True, random_state=0
    )

    # 数据转换为张量
    X = torch.tensor(X, dtype=torch.float32)
    y = torch.tensor(y, dtype=torch.float32)
    coef = torch.tensor(coef, dtype=torch.float32)

    return X, y, coef


def data_loader(x, y, batch_size=16):
    """
    将数据集转换为迭代器，以便在训练过程中进行批量处理。
    """
    # 获取样本数量
    num_samples = x.shape[0]

    # 构建数据索引
    indices = list(range(num_samples))

    # 打乱数据顺序
    random.shuffle(indices)

    # 计算总的批次数量：向上取整
    num_batches = math.ceil(num_samples / batch_size)
    for i in range(num_batches):
        start = i * batch_size
        end = min((i + 1) * batch_size, num_samples)
        # 开始切片数据
        train_X = x[indices[start:end]]
        train_y = y[indices[start:end]]
        # 异步响应数据集
        yield train_X, train_y


if __name__ == "__main__":
    # 构建一批数据集
    X, y, coef = build_dataset()

    # 分批次记载数据
    for x, y in data_loader(X, y):
        print(x, y)

2. 模型函数

参考如下

def linear_regression(x, w, b):
    return torch.matmul(x, w) + b

3. 损失函数

参考如下

# 构建损失函数
def mean_squared_error(y_pred, y_true):
    return torch.mean((y_pred - y_true) ** 2)

4. 优化器

使用梯度下降对参数进行调整…

# 优化器（SGD，手动实现）
def sgd(w, b, dw, db, learning_rate, batch_size):
    w.data -= learning_rate * dw.data / batch_size
    b.data -= learning_rate * db.data / batch_size
    return w, b

5. 参数初始化

代码参考如下

# 初始化参数
def initialize_params(n_features):
    # 随机初始化权重w，并将偏置b初始化为0
    w = torch.randn(n_features, requires_grad=True, dtype=torch.float32)
    b = torch.tensor(0.0, requires_grad=True, dtype=torch.float32)
    return w, b

6. 训练函数

训练函数完成对数据的训练和参数调整等，是一个完整的功能函数~

# 前面的代码这里略掉......
# 训练函数
def train():
    # 1. 构建数据集
    X, y, coef = build_dataset()

    # 2. 初始化模型参数
    w, b = initialize_params(X.shape[1])

    # 3. 定义训练参数
    learning_rate = 0.01
    epochs = 100
    batch_size = 16

    # 4. 开始训练
    for epoch in range(epochs):
        epoch_loss = 0
        num_batches = 0
        for train_X, train_y in data_loader(X, y, batch_size):
            num_batches += 1
            # 5. 前向传播
            y_pred = linear_regression(train_X, w, b)

            # 6. 计算损失
            loss = mean_squared_error(y_pred, train_y)

            # 7. 梯度清零
            if w.grad is not None:
                w.grad.zero_()
            if b.grad is not None:
                b.grad.zero_()

            # 8. 反向传播：会自动计算梯度
            loss.backward()

            # 9. 更新参数
            w, b = sgd(w, b, w.grad, b.grad, learning_rate, batch_size)

            # 10. 训练批次及损失率
            epoch_loss += loss.item()

        print(f"Epoch: {epoch}, Loss: {epoch_loss / num_batches}")


if __name__ == "__main__":
    train()

训练结果观察：

Epoch: 0, Loss: 9388.94959077381
Epoch: 1, Loss: 7991.849659753224
......
Epoch: 9, Loss: 2468.7975725446427
......
Epoch: 15, Loss: 1039.112812829396
......
Epoch: 19, Loss: 581.4362507169209
......
Epoch: 24, Loss: 289.2235103183323
......
Epoch: 33, Loss: 91.27824468461294
......
Epoch: 42, Loss: 36.76937197125147
......
Epoch: 53, Loss: 20.499485742478143
......
Epoch: 99, Loss: 16.240657382541233

7. 项目整合

代码整合：

import math
import random
import torch
import numpy as np
from sklearn.datasets import make_regression
import pandas as pd


def build_dataset():
    """
    使用 sklearn 的 make_regression 方法来构建一个模拟的回归数据集。

    make_regression 方法的参数解释:
    - n_samples: 生成的样本数量，决定了数据集的规模。
    - n_features: 生成的特征数量，决定了数据维度。
    - noise: 添加到目标变量的噪声标准差，用于模拟真实世界数据的不完美。
    - coef: 如果为 True, 会返回生成数据的真实系数，用于了解特征与目标变量间的真实关系。
    - random_state: 随机数生成的种子，确保在多次运行中能够复现相同的结果。

    返回:
    - X: 生成的特征矩阵。
    - y: 生成的目标变量。
    - coef: 如果在调用时 coef 参数为 True，则还会返回真实系数。
    """
    noise = random.randint(1, 3)
    bias = 14.5
    X, y, coef = make_regression(
        n_samples=1000, n_features=5, bias=bias, noise=noise, coef=True, random_state=0
    )
    # 数据转换为张量
    X = torch.tensor(X, dtype=torch.float32)
    y = torch.tensor(y, dtype=torch.float32)
    coef = torch.tensor(coef, dtype=torch.float32)
    bias = torch.tensor(bias, dtype=torch.float32)

    return X, y, coef, bias


def data_loader(x, y, batch_size=16):
    """
    将数据集转换为迭代器，以便在训练过程中进行批量处理。
    """
    # 获取样本数量
    num_samples = x.shape[0]

    # 构建数据索引
    indices = list(range(num_samples))

    # 打乱数据顺序
    random.shuffle(indices)

    # 计算总的批次数量：向上取整
    num_batches = math.ceil(num_samples / batch_size)
    for i in range(num_batches):
        start = i * batch_size
        end = min((i + 1) * batch_size, num_samples)
        # 开始切片数据
        train_X = x[indices[start:end]]
        train_y = y[indices[start:end]]
        # 异步响应数据集
        yield train_X, train_y


# 构建模型函数：权重参数和偏执参数
# 初始化参数
def initialize_params(n_features):
    # 随机初始化权重w，并将偏置b初始化为0
    w = torch.randn(n_features, requires_grad=True, dtype=torch.float32)
    b = torch.tensor(0.0, requires_grad=True, dtype=torch.float32)
    return w, b


def linear_regression(x, w, b):
    return torch.matmul(x, w) + b


# 构建模型函数：损失函数和优化器
def mean_squared_error(y_pred, y_true):
    return torch.mean((y_pred - y_true) ** 2)


# 优化器（SGD，手动实现）
def sgd(w, b, dw, db, learning_rate, batch_size):
    w.data -= learning_rate * dw.data / batch_size
    b.data -= learning_rate * db.data / batch_size
    return w, b


# 训练函数
def train():
    # 1. 构建数据集
    X, y, coef, bias = build_dataset()

    # 2. 初始化模型参数
    w, b = initialize_params(X.shape[1])

    # 3. 定义训练参数
    learning_rate = 0.01
    epochs = 120
    batch_size = 16

    # 4. 开始训练
    for epoch in range(epochs):
        epoch_loss = 0
        num_batches = 0
        for train_X, train_y in data_loader(X, y, batch_size):
            num_batches += 1
            # 5. 前向传播
            y_pred = linear_regression(train_X, w, b)

            # 6. 计算损失
            loss = mean_squared_error(y_pred, train_y)

            # 9. 梯度清零
            if w.grad is not None:
                w.grad.zero_()
            if b.grad is not None:
                b.grad.zero_()

            # 7. 反向传播：会自动计算梯度
            loss.backward()

            # 8. 更新参数
            w, b = sgd(w, b, w.grad, b.grad, learning_rate, batch_size)

            # 10. 训练批次及损失率
            epoch_loss += loss.item()

        print(f"Epoch: {epoch}, Loss: {epoch_loss / num_batches}")
    return coef, bias, w, b


if __name__ == "__main__":
    coef, bias, w, b = train()
    print(f"真实系数: {coef}")
    print(f"预测系数: {w}")
    print(f"真实偏置: {bias}")
    print(f"预测偏置: {b}")

执行结果：

Epoch: 0, Loss: 9141.109053354414
......
Epoch: 9, Loss: 2438.3174680679563
......
Epoch: 18, Loss: 643.4502219548301
......
Epoch: 31, Loss: 100.09944831000433
......
Epoch: 48, Loss: 9.588121845608665
......
Epoch: 64, Loss: 1.8927827449071974
......
Epoch: 119, Loss: 1.006377797278147
真实系数: tensor([41.2059, 66.4995, 10.7145, 60.1951, 25.9615])
预测系数: tensor([41.1517, 66.4983, 10.7523, 60.2103, 25.9089], requires_grad=True)
真实偏置: 14.5
预测偏置: 14.50900650024414

原文地址：https://blog.csdn.net/gs1we1/article/details/144038461

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：faiss VS ChromaDB
下一篇：opencv读写文件操作

基于spring boot的医院挂号就诊系统论文
第二点：设计有效的导航，这个包括每个页面上都有导航条的显示，有时也可以在页面的底部设计导航条，当用户进入具体页面时，要设计相应的位置提示，在页面中比较特殊的位置，需要设计返回链接，可以返回上个页面，也
阅读更多2024-11-28
【Unity踩坑】Unity中父对象是非均匀缩放时出现倾斜或剪切现象
本文解决了Unity中父对象是非均匀缩放时出现倾斜或剪切的问题
阅读更多2024-11-28
「Mac玩转仓颉内测版29」基础篇9 - 数组类型详解
本篇将介绍 Cangjie 中的数组类型，包括数组的定义、创建、访问、常见操作以及在数据管理中的应用，帮助开发者熟练掌握数组的使用。
阅读更多2024-11-28
创建mapreduce项目使用maven
创建mapreduce项目使用maven
阅读更多2024-11-28
Python开源项目周排行 2024年第16周
注:当前文章会不定期进行更新。标签： ERP PDF OCR。
阅读更多2024-11-28
使用EFK收集k8s日志
首先我们使用EFK收集Kubernetes集群中的日志，本次实验讲解的是在Kubernetes集群中启动一个Elasticsearch集群，如果企业内已经有了Elasticsearch集群，可以直接将
阅读更多2024-11-28
C#基础41-45
求n以内（不包括n）同时能被3和7整数的所有自然数之和的平方根s，并作为函数值返回，最后结果s输出到控制台。44.数组x中有n个数，求出奇数的个数cn1和偶数的个数cn2以及数组x下标为奇数的元素值的
阅读更多2024-11-28
JavaScript：遍历一个对象数组，获取每个对象中 mainKeyId 对应的值，并以这个值作为新属性的键名，给该对象添加一个新属性。
假设我们有一个对象数组，每个对象包含一个mainKeyId字段，以mainKeyId的值作为新的键名，并给它添加一个新的属性。
阅读更多2024-11-28
【AI系统】谷歌 TPU v4 与光路交换
TPU v4 通过采用 7nm 工艺，翻倍的 MXU 数量，以及显著增加的内存容量和带宽，实现了性能的大幅提升。特别引人注目的是 Sparse Core 的引入，它专门针对稀疏计算进行了优化，使得 T
阅读更多2024-11-28
SpringBoot文件上传之秒传、断点续传、分片上传
比如，在线教育平台上的视频资源上传，社交平台上的图片分享，以及企业内部的知识文档管理等。这些场景对文件上传的要求也各不相同，有的追求速度，有的注重稳定性，还有的需要考虑文件大小和安全性。这对于大文件上
阅读更多2024-11-28