《神经网络》—— 循环神经网络RNN（Recurrent Neural Network）

🕗 发布于 2024-10-09 01:41 神经网络 rnn 人工智能

文章目录

一、RNN 简单介绍
二、RNN 基本结构
三、RNN 优缺点
- 1.优点
- 2.缺点

一、RNN 简单介绍

循环神经网络（Recurrent Neural Network, RNN）是一种用于处理序列数据的神经网络架构。
与传统的前馈神经网络（Feedforward Neural Network, FNN）不同，传统的前馈神经网络无法训练出具有顺序的数据，在模型搭建时没有考虑数据上下之间的关系
RNN 能够在处理当前输入时考虑到之前的输入信息，可以保留之前输入的信息并继续作为后续输入的一部分进行计算，具有记忆性，因此非常适合处理时间序列数据、文本数据等具有序列特性的数据。

二、RNN 基本结构

RNN的基本结构包括输入层、隐藏层和输出层。
特别地，RNN的隐藏层有一个反馈连接，使其能够保留前一时刻的状态信息。这种结构使得RNN在处理序列数据时，能够将前一时刻的信息传递给当前时刻，从而实现记忆功能。

1.隐藏中的计算

RNN 的隐藏层中引入了 隐状态 h（hidden state）的概念，隐状态 h 可以对序列形的数据提取特征，接着再转换为输出。
下面是处理序列数据长度为4的RNN网络结构图：
隐藏层中隐状态 h 的计算过程如下：
- 每个隐状态 h 的计算结果都将会传入下一个计算的过程，从而实现记忆的功能
- 其中：
  - x 是每一个输入
  - h0 是起始的一个偏执隐状态 h
  - U 是隐状态到隐状态的权重矩阵
  - W 是输入到隐状态的权重矩阵
  - b 是隐藏层的偏置项
  - f 是激活函数，如Tanh或ReLU
- 计算隐状态时，每层隐藏层中的参数（如权重矩阵和偏置向量）在相同层内是相同的，即所谓的参数共享
- 这种参数共享机制减少了模型中的参数数量，使得RNN能够更有效地处理序列数据，并且有助于模型学习到序列中的时间依赖性和上下文信息。

2.输出层的计算

输出层通常根据隐状态 h 来计算，下面是输出层的计算过程：
其中：
- V 是隐状态到输出的权重矩阵
- c 是输出层的偏置项
- 输出层的激活函数通常是Softmax用于分类任务
注意：输入和输出序列必须要是等长的

3.循环

1.循环的基本概念
- 在RNN中，“循环”指的是网络在处理输入序列时，能够保持并传递之前的状态信息到后续的时间步中。这种机制使得RNN能够捕捉到序列数据中的时间依赖性，即当前时刻的输出不仅与当前时刻的输入有关，还与之前时刻的输入和状态有关。
2.循环的实现方式
- RNN通过引入隐状态（hidden state）和循环连接（recurrent connection）来实现信息的循环传递。隐状态是一个向量，它包含了网络在处理当前输入之前所积累的信息。循环连接则是指隐状态在当前时间步被更新后，会作为下一个时间步的输入之一，从而形成一个闭环结构。
- 如下图：

三、RNN 优缺点

1.优点

能够处理序列数据：RNN能够利用之前的输入信息，适用于时间序列分析、自然语言处理等任务。
结构简单：相比于其他复杂的神经网络架构，RNN的结构相对简单，易于理解和实现。

2.缺点

梯度消失/梯度爆炸：RNN在处理长序列时，容易出现梯度消失或梯度爆炸问题，导致难以捕捉长距离依赖关系。
记忆能力有限：虽然RNN具有记忆功能，但其记忆能力有限，难以处理非常长的序列。

原文地址：https://blog.csdn.net/weixin_73504499/article/details/142770470

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

神经网络的基本骨架——nn.Module（torch.nn里的Containers模块里的Module类）
nn：neural network神经网络1、torch.nn：与神经网络有关的库Containers：torch.nn中的一个模块Module：所有神经网络模型的基础类（Base class for
阅读更多2024-10-11
Java有哪些缺点或者局限性
总的来说，Java的缺点和局限性主要集中在性能、内存消耗、启动时间、版本兼容性、学习曲线、GUI开发、代码冗长、并发编程复杂性、动态性不足以及依赖管理等方面。然而，这些缺点和局限性并不是绝对的，它们在
阅读更多2024-10-11
网络协议——IP协议
IPv4，IP地址分类，子网掩码，VLSM，CIDR，IPv4报文格式；IPv6，IPv6书写规则，IPv6报文格式
阅读更多2024-10-11
深入理解Java虚拟机：栈溢出案例分析
深入理解Java虚拟机：栈溢出案例分析
阅读更多2024-10-11
大数据-161 Apache Kylin 构建Cube 按照日期、区域、产品、渠道与 Cube 优化
Apache Kylin 是一个开源的分布式分析引擎，专注于提供大数据的实时OLAP（在线分析处理）能力。Cube（立方体）是 Apache Kylin 的核心概念之一，通过预计算大规模数据的多维数据
阅读更多2024-10-11
使用 Apache SeaTunnel 在 MySQL 和 HTTP 之间的数据同步示例
通过 Apache SeaTunnel 的强大数据集成能力，开发者可以轻松实现多种数据源之间的同步操作。无论是数据库与 API 之间的数据传输，还是跨数据库的数据迁移，SeaTunnel 都为开发者提
阅读更多2024-10-11
＜Project-6 pdf2tx＞ Python Flask 应用：图片PDF图书的中文翻译解决方案
pdf2tx主应用程序 (app.pyapp.py是整个项目的核心，用于处理用户请求、管理前端页面以及实现 OCR 和翻译功能。该程序基于 Flask 框架，提供了简单的 Web 服务，同时使用实现前
阅读更多2024-10-11
Python知识点：基于Python技术，如何使用TensorFlow进行目标检测
通过使用TensorFlow提供的工具和API，你可以构建强大的目标检测系统来解决实际问题。TensorFlow提供了多种预训练模型，如SSD、Faster R-CNN等，你可以根据你的需求选择合适的
阅读更多2024-10-11
RandLA-Net 基于 Tensorflow , 训练自定义数据集
搭建 RandLA-Net 训练环境, 生成自定义训练数据集, 训练自定义数据集.
阅读更多2024-10-11
tensorflow入门案例手写数字识别人工智能界的helloworld项目落地1
数据集市28*28单通道灰度图像])
阅读更多2024-10-11

《神经网络》—— 循环神经网络RNN（Recurrent Neural Network）

文章目录

一、RNN 简单介绍

二、RNN 基本结构

1.隐藏中的计算

2.输出层的计算

3.循环

三、RNN 优缺点

1.优点

2.缺点

相关文章