优化算法（五）—梯度下降算法（附MATLAB程序）

🕗 发布于 2024-09-26 13:51 算法 matlab 开发语言

梯度下降算法（Gradient Descent）是一种常用的优化算法，用于寻找函数的局部最小值。它通过沿着函数梯度的反方向迭代地调整变量，以逐步找到最优解。梯度下降广泛应用于机器学习和深度学习中，特别是在训练模型时优化损失函数。

一、基本原理

梯度下降算法是一种优化算法，用于最小化目标函数。其基本原理如下：

目标函数：设定一个需要最小化的函数（例如，损失函数）。
初始化：随机选择一个初始点（参数值）。
计算梯度：在当前点计算目标函数的梯度（即偏导数），表示函数在该点的上升方向。
更新参数：根据梯度调整参数，更新规则为：

其中，θ是参数，α是学习率，∇J是目标函数的梯度。

5.迭代：重复步骤3和4，直到达到停止条件（如梯度足够小或达到最大迭代次数）。

梯度下降算法的关键在于选择合适的学习率和确保收敛到局部最优解。根据更新的方式，可以分为不同类型，如批量梯度下降、随机梯度下降和小批量梯度下降。

二、公式推导

梯度下降算法的推导主要围绕目标函数的最优化过程。我们以最小化目标函数 J(θ) 为例，下面是详细的推导过程。

1. 定义目标函数

假设我们要最小化的目标函数为 J(θ)，其中 θ 是我们需要优化的参数。

2. 计算梯度

梯度是目标函数对参数的偏导数，表示在当前点上，函数最陡的上升方向。梯度的数学表示为：

这里，∇J(θ) 是一个向量，包含了目标函数在各个参数方向的导数。

3. 更新参数

我们希望通过沿着梯度的反方向更新参数，以减小目标函数的值。更新公式如下：

$\theta _{old}$ 是当前的参数值。
$\theta _{new}$ 是更新后的参数值。
$\alpha$ 是学习率，控制更新的步长。

4. 迭代过程

通过反复应用更新公式，可以不断调整参数，逐步逼近目标函数的最小值。迭代过程可以表示为：

其中 t表示迭代次数。

5. 收敛条件

迭代过程持续进行，直到满足某个停止条件，例如：

梯度的范数小于某个阈值：
参数的变化小于某个阈值：
达到最大迭代次数。

6. 误差分析

选择合适的学习率α 是关键。过大的学习率可能导致发散，过小的学习率则可能使收敛速度缓慢。因此，有时会使用动态调整学习率的方法。

三、MATLAB仿真

下面是一个简单的MATLAB仿真程序，用于实现梯度下降算法以最小化一个二次目标函数 $J\left ( \theta \right )=\theta ^{2}$

% 梯度下降算法示例
% 最小化目标函数 J(θ) = θ^2

% 初始化参数
theta = 10;        % 初始参数值
alpha = 0.1;      % 学习率
num_iterations = 100; % 迭代次数

% 存储每次迭代的目标函数值
J_history = zeros(num_iterations, 1);

% 梯度下降算法
for iter = 1:num_iterations
    % 计算目标函数 J(θ)
    J = theta^2; % 目标函数
    J_history(iter) = J; % 存储目标函数值

    % 计算梯度
    gradient = 2 * theta; % J(θ) 的导数

    % 更新参数
    theta = theta - alpha * gradient; % 更新公式

    % 输出当前迭代的信息
    fprintf('Iteration %d: theta = %.4f, J(θ) = %.4f\n', iter, theta, J);
end

% 绘制目标函数值随迭代次数变化的曲线
figure;
plot(1:num_iterations, J_history, 'b-', 'LineWidth', 2);
xlabel('Iteration');
ylabel('J(θ)');
title('Objective Function Value vs. Iteration');
grid on;

代码说明

初始化参数：
- theta 是优化的初始值。
- alpha 是学习率。
- num_iterations 是迭代次数。
循环进行梯度下降：
- 计算当前参数的目标函数值 JJJ。
- 计算梯度（对于 J(θ)=，梯度是 2θ2\theta2θ）。
- 更新参数 theta。
输出和绘图：
- 在每次迭代中输出当前的参数值和目标函数值。
- 最后绘制目标函数值随迭代次数变化的图。

如何运行

将以上代码复制到MATLAB的脚本文件中（例如 gradient_descent.m），然后运行即可查看梯度下降的过程及目标函数的收敛情况。

四、总结

梯度下降算法是优化问题中一种强大且有效的工具，通过简单的迭代过程，能够在多种应用中找到合适的解。在实际使用中，选择合适的学习率和优化策略是确保其有效性的关键。

优化算法以往链接：

优化算法（一）—遗传算法（Genetic Algorithm）附MATLAB程序-CSDN博客

优化算法（二）—粒子群优化算法（附MATLAB程序）-CSDN博客

优化算法（三）—模拟退火算法（附MATLAB程序）_模拟退火算法csdn-CSDN博客

优化算法（四）—蚁群算法（附MATLAB程序）-CSDN博客

原文地址：https://blog.csdn.net/qq_35623594/article/details/142187654

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：C++ 隐式内联函数
下一篇：直播平台美颜功能开发方案：基于视频美颜SDK的集成详解

leetcode289:生命游戏
根据，简称为，是英国数学家约翰·何顿·康威在 1970 年发明的细胞自动机。给定一个包含m × n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为（live），或0即为
阅读更多2024-10-20
MongoDB数据恢复
注意：两个MongoDB的版本要一致，本文使用的是mongo:4.2.24。先把K8S上面的MongoDB 容器停止（可以把副本改成0）。1、将容器挂载MongoDB的数据目录备份到本地。经常是数据文
阅读更多2024-10-20
C#中实现事务
C#中实现事务
阅读更多2024-10-20
【LeetCode每日一题】——560.和为 K 的子数组
给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。
阅读更多2024-10-20
「漏洞复现」满客宝智慧食堂系统 selectUserByOrgId 未授权访问漏洞
请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任。工具来自网络，安全性自测，如有侵权请联系删除。本次
阅读更多2024-10-20
React面试题目（从基本到高级）
React前端面试常见题目涵盖了React的基础概念、组件、状态管理、生命周期、性能优化等多个方面。
阅读更多2024-10-20
12.个人博客系统（Java项目基于spring和vue）
1 在校学习的学生，可用于日常学习使用或是毕业设计使用 2 毕业一到两年的开发人员，用于锻炼自己的独立功能模块设计能力，增强代码编写能力。 3 亦可以部署为商化项目使用。 4 需要完整资料及源码
阅读更多2024-10-20
YoloV8改进策略：注意力改进|DeBiFormer，可变形双级路由注意力|引入DeBiLevelRoutingAttention注意力模块（全网首发）
本次改进的核心在于将DeBiLevelRoutingAttention模块嵌入到YoloV8的主干网络中，具体位置是在SPPF（Spatial Pyramid Pooling Fast）模块之后。这一
阅读更多2024-10-20
word取消自动单词首字母大写
情况说明：在word输入单词后首字母会自动变成大写取消单词首字母大写步骤：（1）点击菜单栏文件（2）点击“更多”——>“选项”（3）点击“校对”——>“自动更正选项”（4）取消“句首字母大
阅读更多2024-10-20
web前端网页用户注册页面
【代码】web前端网页用户注册页面。
阅读更多2024-10-20