pytorch实现RNN网络

🕗 发布于 2024-09-21 13:44 pytorch rnn 深度学习

1.导包

2. 加载本地文本数据

3.构建循环神经网络层

4.初始化隐藏状态state

5.创建随机的数据，检测一下代码是否能正常运行

6. 构建一个完整的循环神经网络¶

7.模型训练

8.个人知识点理解

1.导包

import torch
from torch import nn
from torch.nn import functional as F
import dltools

2. 加载本地文本数据

#声明变量:批次大小（一批所取的数据量）、子序列的长度
batch_size, num_steps =32, 35
#获取训练数据的迭代器， 词汇表
train_iter, vocab = dltools.load_data_time_machine(batch_size=batch_size, num_steps=num_steps)

3.构建循环神经网络层

#声明变量:隐藏层的神经元数量（每个神经元都会有一个输出）
num_hiddens = 256
#构建一个具有256个隐藏单元的单隐藏层的循环神经网络
#num_layers=1默认值：一层神经网络
rnn_layer = nn.RNN(input_size=len(vocab), hidden_size=num_hiddens, num_layers=1)

4.初始化隐藏状态state

# 括号中的1：因为num_layers=1默认值：一层神经网络
state = torch.zeros((1, batch_size, num_hiddens))
state.shape

torch.Size([1, 32, 256])

5.创建随机的数据，检测一下代码是否能正常运行

X = torch.rand(size=(num_steps, batch_size, len(vocab)))
#传入X和初始化时的state，获取Y和state_new
Y, state_new = rnn_layer(X, state)
Y.shape, state_new.shape


#有输出表示代码正常运行！！！

(torch.Size([35, 32, 256]), torch.Size([1, 32, 256]))

6. 构建一个完整的循环神经网络¶

.long() 方法‌：这是PyTorch张量的一个方法，用于将张量的数据类型转换为torch.long。torch.long是一种整数数据类型，通常用于索引或存储不需要浮点数精度的整数数据。

class RNNModel(nn.Module):   #继承nn.Module
    #初始化（需要用到的）参数，  **kwargs表示继承的其他参数（不一一写明的意思）
    #vocab_size = len(vocab)
    def __init__(self, rnn_layer, vocab_size, **kwargs):
        #继承父类的属性和方法
        super().__init__(**kwargs)
        self.rnn_layer = rnn_layer
        #词汇表的长度
        self.vocab_size =vocab_size
        self.num_hiddens = self.rnn_layer.hidden_size
        
        #判断是否为双向循环
        if not self.rnn_layer.bidirectional:
            self.num_directions = 1
            #nn.Linear用于定义线性层的类，一般用于全连接层
            self.linear = nn.Linear(in_features=self.num_hiddens, out_features=self.vocab_size)
        else:
            self.num_directions = 2
            self.linear = nn.Linear(self.num_hiddens*2, self.vocab_size)
    
    #定义了数据在模型中的前向传播过程。（串联每一件事件的逻辑顺序）
    def forward(self, inputs, state):
        #one_hot编码，处理输入的X数据，此时的X.shape=(batch_size, num_steps)
        #。T转置之后，X.shape=（num_steps，batch_size）
        #one_hot编码之后， X.shape=（num_steps，batch_size, len(vocab）
        X = F.one_hot(inputs.T.long(), self.vocab_size)
        #将数据转化为tensor
        X = X.to(torch.float32)
        Y, state = self.rnn_layer(X, state)
        #此时，Y.shape = torch.Size（num_steps, batch_size, num_hiddens）
        
        #输出层:Y.shape必须是一个二维的， -1表示合并Y.shape中的num_steps与batch_size,
        outputs = self.linear(Y.reshape(-1, Y.shape[-1]))
        return outputs, state
                              
   # 初始化隐藏状态
    def begin_state(self, device, batch_size=1):
        return torch.zeros((self.num_directions * self.rnn_layer.num_layers, batch_size, self.num_hiddens), device=device)

#在训练之前，基于随机初始化的权重进行预测，测试模型
device = dltools.try_gpu()
rnn_net = RNNModel(rnn_layer, vocab_size=len(vocab))
rnn_net = rnn_net.to(device)
dltools.predict_ch8(prefix='time traveller',
                    num_preds=10, 
                    net=rnn_net, 
                    vocab=vocab, 
                    device=device)

'time travellergghhhhhhhh'

7.模型训练

#声明变量
#模型训练时，可以先让学习率的值稍大一些，让梯度下降的快一些，然后
#梯度下降到一定程度再改成较小的值
num_epochs, lr = 500, 0.1
dltools.train_ch8(net=rnn_net, 
                  train_iter=train_iter, 
                  vocab=vocab, 
                  lr=lr, 
                  num_epochs=num_epochs, 
                  device=device)

8.个人知识点理解

原文地址：https://blog.csdn.net/Hiweir/article/details/142282618

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：负载均衡：从理论到实践 ---day04
下一篇：从底层原理上解释 ClickHouse 的索引

【d45】【Java】【力扣】206.反转链表
解法1：适用于数字不多的1.把节点的数，都放进一个arraylist中2.调用Collections.reverse(list)方法，将list转置3.再遍历list，逐个放入数字解法1记录总结
阅读更多2024-09-21
Mupdf 图像处理
好的，让我们来组合所有这些图像处理方式的选项，以便更好地理解它们的用法。
阅读更多2024-09-21
【Docker】安装及使用
Docker Desktop是官方提供的桌面版Docker客户端，在Mac上使用Docker需要安装这个工具。.dmg。
阅读更多2024-09-21
俄罗斯的Alexey V. Gubin开发的数据恢复文件-零假设恢复只读模式下对扫描/恢复数据起作用-供大家学习研究参考
针对FAT，NTFS，EXT和XFS文件系统的唯一最佳数据恢复解决方案（具有最准确的数据扫描和恢复功能）。它是由来自俄罗斯的Alexey V. Gubin开发的，在数据&
阅读更多2024-09-21
CRMEB商城系统运营配置——第三方接口配置（电子面单）
电子面单在现代物流管理中起着不可或缺的作用，它能在商城爆单时简化订单发货打印流程，快速准确处理订单，在多渠道销售时实现统一发货，减少人工处理错误，还能高效实现数据同步，提高物流信息化管理水平。今天我们
阅读更多2024-09-21
Python的学习步骤
学习Python的基本语法，包括变量、数据类型、运算符、控制流（if语句、循环）等。- 推荐资源：Python官方博客、Reddit的Python板块。- **项目驱动**：通过构建项目来学习，这样可
阅读更多2024-09-21
Redis——持久化策略
Redis——持久化策略
阅读更多2024-09-21
harbor集成trivy镜像扫描工具
前置条件：安装好docker和docker-compose。
阅读更多2024-09-21
arthas -- xxljob本地调试
之所以命名 ApplicationContextProvider1 是因为源码中包含 ApplicationContextProvider，不然会导入该类跳过执行。复制路径：@cn.wanda.wic
阅读更多2024-09-21
LeetCode 260. 只出现一次的数字 III
更多题解尽在每日更新。组队打卡，更多解法等你一起来参与哦！，难度。
阅读更多2024-09-21

pytorch实现RNN网络

1.导包

2. 加载本地文本数据

3.构建循环神经网络层

4.初始化隐藏状态state

5.创建随机的数据，检测一下代码是否能正常运行

6. 构建一个完整的循环神经网络¶

7.模型训练

8.个人知识点理解

相关文章