吴恩达深度学习笔记（4）---加速神经网络训练速度的优化算法

🕗 发布于 2024-10-19 00:19 深度学习 笔记神经网络

机器学习的应用是一个高度依赖经验，不断重复的过程，需要训练很多模型才能找到一个确实好用的。

小批量梯度下降算法：

矢量化可以有效计算m个算例而不需要for循环，因此我们需要将所有的训练样例放入巨型矩阵中。但是当数据量超大时，计算时间仍需很久，可以考虑将训练集分为微小的训练集，即小批量训练集。

对于一个小的训练集进行下图计算，也叫做训练集的一次遍历。

梯度下降过程中，代价函数是不断下降的，但是小批量的代价函数趋势是下降，过程中有噪声。

设置一个批量的参数，极端情况是一个小训练集的样本是所有样本，这种情况下，每次需要遍历全部的样本，另一个极端情况是一个样本一个集合（随机梯度下降）,如下图，一个下降步长大，另一个随机噪声很大，虽然可以通过小的学习率改善，但是一般很难收敛到最低点，而是在最低点周围波动，同时失去了可以利用向量加速运算的机会

因此参数要取合适值

可以利用向量加速运算
不必每次遍历全部的样本再进行梯度下降

参数的选择

当样本数小于2000时，不需要用
其他情况下可以设置2的幂次，常见的为：64、128、256、512

指数加权（滑动）平均（基本理论）：

指数加权平均的函数：

当增大，曲线右移，更加平滑。

假设样本有100个，将指数加权平均的函数展开可得下式，所有系数之和等于或接近1。

在算法开始初始值设置为0时，将会导致前几个数字结果不能很好拟合

在算法估算初期用代替。

动量（动量梯度下降）

他比标准梯度下降算法更快，算法主要计算梯度的指数加权平均，之后使用这个梯度过更新权重。

梯度下降算法产生的这种上下震荡会减慢梯度下降的速度，并且不能用较大的学习率，否则会超调。因此希望在纵轴上减慢学习速度，在横轴上加快学习速度

上述方法可以让梯度下降的每一步变得平滑，算法对于一些问题有效，但是对于碗型的函数

，由于加速度使速度变快，但是小于1相当于摩檫力，所以球不会无线加速。

RMSprop均方根传递：

我们希望在纵轴方向上学习速度减慢，在横轴方向上保持不变或者加快

适应性矩估计（adam）算法优化：

学习速率衰减：

缓慢的降低学习率，在初始阶段取较大值，步长大，随着学习率下降，步长变小，可以收敛于一点。

局部最优解问题：

如果我们建立一个神经网络，通常梯度为零的点，并不是如左图中的局部最优点，而是右图中的鞍点

原文地址：https://blog.csdn.net/weixin_43899239/article/details/142961891

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：校园周边美食探索及分享平台的设计与实现(论文+源码)_kaic
下一篇：RK3588的demo板学习

OpenLayers：构建现代Web地图应用
OpenLayers 是一个用于绘制地图的开源 JavaScript 库。它提供了丰富的 API 和工具集，允许开发者创建高性能的地图应用，并且支持多种图层源，如矢量数据、瓦片服务等。OpenLaye
阅读更多2024-10-20
Web 应用防火墙(WAF)
在现代Web应用开发中，作为反向代理的架构被广泛采用。这种架构具备高性能、易扩展的特点，但也带来了Web层的安全挑战。Web应用防火墙（WAF）作为专门防御Web应用层攻击的安全措施，能够为此架构增加
阅读更多2024-10-20
二叉平衡树（AVL树）Java语言实现
将A的左孩子B向右上旋转代替A成为根结点，将A结点向右下旋转成为B的右子树的根结点，而B的原右子树则作为A结点的左子树。将A的右孩子B向左上旋转代替A成为根结点，将A结点向左下旋转成为B的左子树的根结
阅读更多2024-10-20
深入了解路由
路由是网络中将数据包从源地址传送到目标地址的过程。它涉及网络设备（如路由器）根据某种算法和策略，决定数据包下一步应该去往的路径。路由的核心功能是通过多条路径之间进行选择，确保数据可以高效、可靠地从发送
阅读更多2024-10-20
OpenWRT 和 Padavan 路由器配置网络打印机实现远程打印
之前有给大家介绍过 Armbian 安装 CUPS 作为打印服务器，像是 N1 盒子、玩客云，甚至是随身 WiFi 都可以通过 CUPS 来进行打印。但是有些朋友不想专门为打印机添置一个设备，如果你恰
阅读更多2024-10-20
cadvisor
cAdvisor（容器顾问）可帮助容器用户了解正在运行的容器的资源使用情况和性能特征。它是一个运行守护进程，用于收集、汇总、处理和导出有关正在运行的容器的信息。具体来说，它为每个容器保存资源隔离参数、
阅读更多2024-10-20
SpringBoot车辆管理系统：设计与实施细节
一个成功的网站应明确建设网站的目的，确定网站的功能，确定网站规模、投入费用，进行必要的市场分析等。6、网络上的客户端和服务器可以用来编程任何独立的编程环境，也有中国，GB2312，BIG5，日文写作，
阅读更多2024-10-20
文字跑马灯：实现文字自动滚动策略的原理分析
在本文中，我们详细分析了如何实现文字跑马灯效果，通过判断文字内容是否超出容器，进而实现自动滚动的功能，为网站添加了一个引人注目的动画效果。下面我来进行总结一下，实现文字滚动效果有以下几个要点：判断文字
阅读更多2024-10-20
2062：【例1.3】电影票
已知一位小朋友的电影票价是10元，计算x位小朋友的总票价是多少？人数和电影票总价，中间用一个空格隔开。
阅读更多2024-10-20
用自己的数据集复现YOLOv5
2.改好模型配置文件和数据加载配置文件，分别在E:\project\MODEL\YOLO\yolov5-master\modelsyolov5s.yaml和E:\project\MODEL\YOLO\
阅读更多2024-10-20