【LLM学习之路】9月16日第六天

🕗 发布于 2024-09-22 07:53 学习 pytorch 人工智能

【LLM学习之路】9月16日第六天

损失函数

L1Loss

可以取平均也可以求和

参数解析

input （N，*） N是batchsize，星号代表可以是任意维度不是输入的参数，只是描述数据

target 形状要同上

MSELoss平方差

CrossEntropyLoss交叉熵

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

inputs的形状要是(N, C) N是批次大小

x = torch.tensor([0.1,0.2,0.3]) #形状为 (3,) 的 1D 张量
y = torch.tensor([1])
x = torch.reshape(x,(1,3)) #inputs 的形状要是 (N, C)
loss_cross = nn.CrossEntropyLoss()
result_cross = loss_cross(x,y)

反向传播

result_loss.backward()

优化器

套路是这样的

optim = torch.optim.SGD(tudui.parameters(),loss=0.01)
optim.zero_grad() 进行梯度清零
result_loss.backward() 反向传播计算梯度
optim.step() 对模型参数进行调优

后面自己添加了如何使用显卡

import torch
import torchvision.datasets
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear, Sequential
from torch.utils.data import DataLoader
# 检查是否有 GPU 可用
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"Using device: {device}")

dataset = torchvision.datasets.CIFAR10("./data",train = False,download=True,transform=torchvision.transforms.ToTensor())
dataloader = DataLoader(dataset,batch_size=1)
class Tudui(nn.Module):
    def __init__(self):
        super(Tudui,self).__init__()
        self.conv1 = Conv2d(3,32,5,padding=2)
        self.maxpool1 = MaxPool2d(2)
        self.conv2 = Conv2d(32,32,5,padding=2)
        self.maxpool2 = MaxPool2d(2)
        self.conv3 = Conv2d(32,64,5,padding=2)
        self.maxpool3 = MaxPool2d(2)
        self.flatten = Flatten()
        self.linear1 = Linear(1024,64)
        self.linear2 = Linear(64,10)

        self.model1 = Sequential(
            Conv2d(3, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 64, 5, padding=2),
            MaxPool2d(2),
            Flatten(),
            Linear(1024, 64),
            Linear(64, 10)
        )

    def forward(self,x):
        x = self.model1(x)
        return x
loss = nn.CrossEntropyLoss()
tudui = Tudui().to(device)
optim = torch.optim.SGD(tudui.parameters(),lr=0.01)

for epoch in range(20):
    running_loss = 0.0
    for data in dataloader:
        imgs,targets = data
        imgs,targets = imgs.to(device), targets.to(device)
        outputs = tudui(imgs)
        # print(outputs)
        # print(targets)
        result_loss = loss(outputs,targets)
        optim.zero_grad()
        result_loss.backward()
        optim.step()
        # print("ok")
        running_loss = result_loss + running_loss

    print(running_loss)

完整的模型验证套路

利用已经训练好的模型，然后给它提供输入

原文地址：https://blog.csdn.net/u014448315/article/details/142387809

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【pyVista】在三维模型中的网格属性
下一篇：VCNet论文阅读笔记

初写MySQL四张表:(4/4)
这次在实现需求之前，我做了一些准备工作：删除了原先的数据，再统一添加数据，既为了自然插入删除操作的学习，趁机复习添加数据语句。（因为我发现需求里面没有删除操作）
阅读更多2024-09-22
全国77个城市建筑物轮廓矢量数据
建筑物轮廓矢量数据是一种二维矢量数据，它详细记录了建筑物的边界形状、面积和高度等信息。这些数据通常采用SHP或CAD格式，并使用WGS84坐标系。建筑物轮廓矢量数据的精度高、可编辑性强，使其成为城市规
阅读更多2024-09-22
Linux下编程实现网络传送文件(改良1版）
Linux下编程实现网络传送文件(改良1版）
阅读更多2024-09-22
Python习题 196：用元类实现单例模式
（编码题）有一个名为 GirlFriend 的类，使用 Python 元类技术，实现允许只能实例化一次，即实现单例模式。元类是类的类，可以用于控制类的创建行为。通过定义一个元类，在元类中控制类的实例化
阅读更多2024-09-22
Windows最快2步安装Ubuntu（WSL高效实操版）
本文提供了在Windows上通过WSL2快速安装Ubuntu的详细步骤。首先，需要确认或安装WSL2，Windows 11用户默认已安装。若未安装，可通过命令wsl --install进行。接着，通过
阅读更多2024-09-22
构建高可用和高防御力的云服务架构第二部分：SLB负载均衡（2/5）
负载均衡是一种计算机网络技术，用于将工作任务（例如传输流量或请求）均匀地分配到多个服务器或其他资源上。这种技术能够提升网络服务的响应速度、可用性和可靠性，同时降低单个服务器的负载压力。SLB（Serv
阅读更多2024-09-22
DevExpress WinForms v24.1新版亮点：升级的HTML & CSS支持
DevExpress WinForms控件2024年第一个重大版本——v24.1全新发布，新版本更好的支持HTML & CSS、增强文档管理器功能等，欢迎下载最新版体验！
阅读更多2024-09-22
LeetCode 每周算法 6（图论、回溯）
【代码】LeetCode 每周算法 6（图论、回溯）
阅读更多2024-09-22
日志系统第二弹：设计模式介绍，C和C++不定参函数的介绍
设计模式介绍、C和C++不定参函数的介绍
阅读更多2024-09-22
Python互相关统计学地震学心理学数学物理和算法模型及数据科学应用
1. 同步时间序列数据2. 地震时频域信息3. 绘制地震噪声干涉图和频谱4. 计算光变曲线和时滞5. 互相关光变曲线并计算峰值和质心6. 图像几何对应关系算法7. 气候相关矩阵图8. 测量麦克风间距离
阅读更多2024-09-22

【LLM学习之路】9月16日 第六天

【LLM学习之路】9月16日 第六天

损失函数

L1Loss

MSELoss平方差

CrossEntropyLoss交叉熵

优化器

完整的模型验证套路

相关文章

【LLM学习之路】9月16日第六天

【LLM学习之路】9月16日第六天