深度学习：循环神经网络—RNN的原理

🕗 发布于 2024-10-09 21:22 深度学习 rnn 人工智能 学习神经网络

传统神经网络存在的问题？

无法训练出具有顺序的数据。模型搭建时没有考虑数据上下之间的关系。

RNN神经网络

RNN（Recurrent Neural Network，循环神经网络）是一种专门用于处理序列数据的神经网络。在处理序列输入时具有记忆性，可以保留之前输入的信息并继续作为后续输入的一部分进行计算。

RNN的工作原理

隐藏状态更新

输出计算

RNN特点：引入了隐状态h（hidden state）的概念，隐状态h可以对序列形的数据提取特征，接着再转换为输出。

将初始隐藏状态 h0 与参数矩阵 W 相乘，将第一个词向量 x1 与参数矩阵U 相乘，两个结果相加，并加上偏置 b。重复上述步骤，将 h1 与 W 相乘，将 x2 与 U相乘，相加后加上偏置 b，再通过激活函数 f得到 h2。

将隐藏状态 ht与一个参数矩阵 V 相乘，然后加上一个偏置 c

在计算时，每一步使用的参数U、W、b都是一样的，也就是说每个步骤的参数都是共享的，

RNN结构中输入是x1, x2, .....xn，输出为y1, y2, ...yn，也就是说，输入和输出序列必须要是等长的

RNN的局限：

记忆能力有限，梯度消失和梯度爆炸，难以捕捉到长期依赖关系

原因是：梯度会随着时间的推移不断下降减少，而当梯度值变得非常小时，就不会继续学习。

原文地址：https://blog.csdn.net/mohanyelong/article/details/142794171

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：docker compose入门5—创建一个3副本的应用
下一篇：Redis：分布式 - 主从复制

PyCharm 项目解释器切换指南：如何在项目中更换 Python Interpreter
本文详细介绍了在 macOS 系统中，如何通过 PyCharm 更换现有项目的 Python 解释器（Interpreter）。首先，用户可以通过 PyCharm 的 Settings 菜单进入项目设
阅读更多2024-10-11
Elasticsearch Suggester
在当今的互联网时代，用户期望得到即时且准确的信息反馈。无论是电子商务网站上的产品搜索，还是社交网络中的用户资料查找，快速而精确的搜索体验已成为提升用户体验的关键因素之一。Elasticsearch 作
阅读更多2024-10-11
【目标检测】室内地板砖铺设缺陷检测数据集2000张VOC+YOLO格式
数据集格式：Pascal VOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)标注类别名称:["TILE_BREA
阅读更多2024-10-11
《大模型应用开发极简入门》学习成为善用 AI 的人！看完懂得90%的大模型！{含pdf版电子书}_大模型应用开发极简入门 pdf
真心建议学习大模型的朋友都去看看这本书，作为一本应用开发入门书，在豆瓣评分好评不断，其中知识点有不少值得深入研究的领域，适合小白初学者阅读学习的！最近Sora的大火让人们再次见识到了大模型的能力和未来
阅读更多2024-10-11
C/C++逆向：函数逆向分析-总体流程（整型&指针）
在逆向工程中，函数的初始化操作是函数在开始执行时，为正确运行而进行的准备工作。在本文中，我们深入探讨了函数逆向工程的整体流程，通过对函数的结构、调用约定及其参数传递方式的详细分析，能够有效地识别和理解
阅读更多2024-10-11
ELK中L的filebeat配置及使用（超详细）
Filebeat是一种轻量型日志采集器，内置有多种模块（auditd、Apache、NGINX、System、MySQL 等等），可针对常见格式的日志大大简化收集、解析和可视化过程，只需一条命令即
阅读更多2024-10-11
Leetcode 数组中第 k 大的元素
使用最小堆 (min-heap) 来解决该问题。
阅读更多2024-10-11
C++学习笔记----8、掌握类与对象（六）---- 操作符重载（3）
对于两个SpreadsheetCell对象的比较，编译器会用operator==与<=>重写这样的表达式，有选择性的交换参数的顺序。例如，10 < myCell首先会被重写成is_l
阅读更多2024-10-11
Zilliz获Forrester报告全球第一；OB支持向量能力；Azure发布DiskANN；阿里云PG发布内置分析引擎
alloydb_scann”扩展程序（以前称为“postgres_scann”）已正式发布（GA），如需详细了解如何存储向量嵌入、创建索引以及调整索引以实现更快的查询性能和更好的召回率，请参阅使用向量
阅读更多2024-10-11
react中的重定向Redirect
一般写在所有路由注册的最下方，当所有路由都无法匹配时，跳转到Redirect指定的路由。
阅读更多2024-10-11