【深度学习】初识神经网络

🕗 发布于 2024-09-20 09:36 神经网络 人工智能 深度学习

神经网络的表示

一个简单的两层神经网络如下图所示，每个圆圈都代表一个神经元，又名预测器。

一个神经元的计算详情如下。在我们原本输入的变量x的基础上，还有权重w和偏置b；在计算z过后，再将其带入sigmoid激活函数，得到a；如果神经元所在的层为最后一层，便可进行损失函数的计算，在进行前向传播。

如果神经元所在的层并非最后一层，需要进行重复的z、a计算。右上角括号内的数字，代表在神经网络中所处的层数。

下面是神经网络各个层的表示，以单隐藏层/双层神经网络为例:

在神经网络的表示中，可以看到一个神经元的处理包括两个步骤，第一个是输出z，第二个是输出a。我们可以得到详细的符号表示：

我们可以将一个训练样本的参量进行堆叠，形成一个矩阵：

最终可以转换为矩阵的运算：

多个样本的向量化

当拥有m个训练样本时，我们需要一个for循环进行计算。为了减少计算量，我们可以将for循环通过向量化的方式进行替代。其中，方括号中的数字代表的是所处的层数，圆括号中的数字代表的是第几个训练样本，对于一个a[1](1)或者是一个z[1](1)这样一个列向量，第一行为第一个隐藏单元，第二行为第二个隐藏单元。

更详细地来说，我们有m个样本，不使用矩阵的表示形式，我们需要进行for循环，依次进行第一个样本到第m个样本的遍历。其中，x(i)代表的是第i个样本的参数矩阵[x1, x2, x3]；W[1]的矩阵大小为4x3（4行3列），每一列都对应一个神经元，每一行都代表对应参数的权重值。

激活函数

各类激活函数

sigmoid激活函数适用范围较窄，通常在二元分类的输出层使用，因为在其他场景下，tanh比sigmoid更好用。如果不知道使用什么激活函数，就采用ReLu激活函数，也可以尝试一下Leaky ReLu（ReLu的改进版）。

对于sigmoid和tanh激活函数来说，导数的梯度，函数的斜率可能会随着z的增大或减小而减小。而ReLu函数，a=max(0，z)，将会解决这一问题。通常情况下，我们只会在二元分类的输出输出层使用sigmoid。如果不知道隐藏层使用什么激活函数，就使用修正线性单元（ReLu）但是当当z为负的时候，导数为0，为了避免这个缺点，Leaky ReLu出现了，当z为负的时候拥有一个很小的斜率值。

为什么需要非线性激活函数

事实证明，要让神经网络计算出有趣的函数，我们不得不使用非线性激活函数。如果使用一个线性激活函数和一个sigmoid激活函数，其计算复杂度与一个logistic回归函数是相同的。而两个线性函数的组合，与一个线性函数无异。

激活函数的导数

当对神经网络进行前向传播的时候，需要进行导数或者斜率的计算。

原文地址：https://blog.csdn.net/weixin_62403234/article/details/142345024

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：0.5.4 知识库管理微调
下一篇：Github 2024-09-19 Go开源项目日报 Top10

MinIo在Ubantu和Java中的整合
方法抛出的各种异常进行了捕获，然后打印了异常信息，目前这种处理逻辑，无论Minio是否发生异常，前端在上传文件时，总是会受到成功的响应信息。会处理所有Controller方法抛出的异常，因此Contr
阅读更多2024-11-15
HTTP基础
当浏览者访问一个网页时，浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前，此网页所在的服务器会返回一个包含HTTP状态码的信息头（server header）用以响应浏览器的请求。H
阅读更多2024-11-15
linux phy mdio 读取工具
【代码】linux phy mdio 读取工具。
阅读更多2024-11-15
sql文件
sql文件通常包含SQL语句，用于数据库的创建、修改和数据操作。根据内容的不同，.sql文件的使用方式也有所不同。
阅读更多2024-11-15
MongoDB创建只读用户并授权指定集合的查询权限
创建一个自定义角色，只允许在。集合上执行查询操作。
阅读更多2024-11-15
#渗透测试#SRC漏洞挖掘#云技术基础03之容器相关
Podman是Docker的替代产品，它无守护进程。在运行容器时，若不加sudo启动可能会报错，因为默认禁止侦听1024以下端口，例如运行httpd容器可以使用命令。Kubernetes，通常简称为K
阅读更多2024-11-15
Linux权限和开发工具(3)
我们在做项目的时候可能会遇到对自己的修改不满意,想要回到上一个版本时候,就需要对自己完成一个阶段,对当前阶段进行备份,就方便我们后续进行版本回退了。后的程序可以执行但是文件也会大一些,让生成的程序带上
阅读更多2024-11-15
C++ 编程基础（5）类与对象 | 5.8、面向对象五大原则
在软件开发领域，面向对象编程（OOP）是一种重要的编程范式，它通过封装、继承和多态等特性，提高了代码的可重用性、灵活性和可维护性。C++作为一种强大的面向对象编程语言，充分体现了这些原则。在面向对象的
阅读更多2024-11-15
Tailwind 安装使用
Tailwind 安装使用
阅读更多2024-11-15
JavaScript中的二叉树排序你了解吗？
在计算机科学中，二叉树是一种常见的数据结构，用于存储和组织数据。二叉树排序（Binary Tree Sort）是一种基于二叉搜索树的排序算法。它的基本思想是将待排序的元素插入到二叉搜索树中，然后通过中
阅读更多2024-11-15