pytorch-LSTM

🕗 发布于 2024-07-13 15:18 lstm pytorch rnn

1. RNN存在的问题

如下图：RNN能满足预测下一个单词，但是对于获取更多的上下文信息就做不到了。
在这里插入图片描述

2. LSTM的由来

RNN能做到短时记忆即short time memory，而LSTM相对RNN能够处理更长的时间序列，因此被称为LSTM即long short time memory

RNN有一串重复的模块，这些模块使用统一的权重Whh和Wih
在这里插入图片描述
LSTM也有一连串的类似结构，但是重复模块是不同的结构，它用四个单层的神经网络替代，并以指定的方式相互作用。它有三个门，分别是遗忘门、输入门和输出门。

3. LSTM门

门是一种信息过滤方式，他们由sigmod函数和点乘操作组成，sigmod范围是0~1，因此通过sigmod函数可以控制输出。
在这里插入图片描述

3.1 遗忘门

遗忘门f_t是h_t-1和x_t经过一系列运算，再经过sigmod函数得到的
在这里插入图片描述

3.2 输入门

输入门由两部分组成，一个是i_t输入门层，它是通过h_t-1和x_t经过一系列运算，再经过sigmod函数得到的。
另一个是新的输入C_t^’，这里没有直接使用x_t作为输入，而是通过h_t-1和x_t经过一系列运算，再经过tanh函数得到新的输入C_t^’。

在这里插入图片描述
最后输出C_t = f_t*C_t-1 + i_t*C_t^’

3.3 输出门

输出门o_t也是通过h_t-1和x_t经过一系列运算，再经过sigmod函数得到的。
最后的输出h_t = o_t*tanh(C_t)
注意：LSTM中h_t已经不是memory了，而是输出，C_t才是memory
在这里插入图片描述
可以看出每个门的运算都与h_t-1和x_t相关，并且通过sigmod函数来控制门的开度，最后的输出h_t使用了tanh

输入们和遗忘门门的组合，会得到不同的值，如下图：

4. LSTM是如何减轻梯度弥散问题

从梯度计算公式可以知道，RNN的梯度中有W_hh的累乘，当W_hh<1时，就可能出现梯度弥散，而LSTM梯度由几项累加得到，即使W很小也很难出现梯度弥散。
在这里插入图片描述

原文地址：https://blog.csdn.net/wyw0000/article/details/140368353

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：如何替换掉4605534这个数字，不包含14605534或者46055341这种
下一篇：【漏洞复现】方正全媒体采编系统——binary.do——SQL注入

谷歌推出设备内置人工智能，实时向手机用户发出诈骗电话警报
Google 宣布推出适用于 Android 的新安全功能，可实时防御诈骗和有害应用。
阅读更多2024-11-16
动手学深度学习70 BERT微调
13 bert一般可以用工具转成c++ 开销大。考虑怎么提升bert性能。14 设备性能不高，可以用蒸馏bert。模型中有大量冗余的东西。9 10, 一般不固定，固定参数可以使训练速度加快，可以尝试
阅读更多2024-11-16
怎么改变网络IP地址：实用指南与注意事项
在数字化时代，IP地址作为设备连接互联网的“身份证”，扮演着至关重要的角色。无论是出于隐私保护、访问限制绕过，还是网络安全考虑，有时我们需要更改设备的IP地址。然而，对于许多非技术用户而言，这一过程可
阅读更多2024-11-16
huggingface 下载方法测试ok
huggingface 下载方法：
阅读更多2024-11-16
计算机网络（10）网络性能
在计算机网络中，网络性能是指网络传输数据的效率、速度和稳定性。
阅读更多2024-11-16
Springboot校园失物招领平台
Springboot校园失物招领平台
阅读更多2024-11-16
HarmonyOS 如何获取设备信息（系统、版本、网络连接状态）
HarmonyOS 提供了一个强大的 API 集，方便开发者获取设备的硬件和软件信息。通过模块的deviceInfo接口，开发者可以访问设备的型号、品牌、系统版本等详细信息。本文将详细介绍如何使用这些
阅读更多2024-11-16
Vue3集成搜索引擎智能提示API
问题：因为API返回的是JSONP数据，JSONP是跨域访问的一种方式，网上很多都是用的原生的 js 代码去发送请求，嵌入到vue中不太方便，因此我想着vue能不能直接发送jsonp 请求，后面发现v
阅读更多2024-11-16
【Linux】Linux 权限的理解
本文简单介绍了Linux的基础知识--权限。
阅读更多2024-11-16
Python 中.title()函数和.lower()函数
将字符串中的每一大写字母都变成的小写字母。将字符串中的每一单词的首字母大写。1.lower()函数的功能。1.title()函数的功能。一.title()函数。二.lower()函数。
阅读更多2024-11-16