机器学习—多元线性回归的梯度下降法

🕗 发布于 2024-10-18 05:45 机器学习 线性回归 人工智能

现在已经学会了梯度下降，关于多元线性回归和矢量化，让我们把他们放在一起实现多元线性回归的梯度下降，用因式分解，让我们快速回顾一下多元线性回归是什么样子的，使用我们前面的表示法，让我们看看如何使用向量表示法更简洁的编写它，我们有参数W1-Wn和b，但是不要把W1和Wn看作是单独的数字，这是单独的参数，让我们把所有的w收集成向量W，所以W是一个长度向量，所以我们将把这个模型的参数看作一个向量W以及b，其中b仍然是一个与以前相同的数，而在我们定义像这样的多元线性回归之前，现在使用向量表示法，我们可以把模型写成f(x)=w*x+b，记住*代表的是点积，我们的成本函数可以定义为W1-Wn,b,但是不只是把j看作这些n的函数，不同参数w,j,b。我们将j写成参数向量w的函数，所以这个通过Wn的w被替换为这个向量W，现在j接受一个向量w和数字b作为输入，并返回一个数字，这是梯度下降的样子。我们将反复更新每个参数Wj为Wj-alpha*j的导数，再一次把它写成向量W和b的j

当实现梯度下降时会是什么样子

尤其让我们看看导数项，我们将看到梯度下降变得有点不同，有多个特征，与只有一个功能相比，这是我们用一个特征进行梯度下降时的情况，我们对W有一个更新规则，对B有一个单独的更新规则，紫色线画的是成本函数j的导数，关于参数w，同样我们有一个参数b的更新规则，带有单变量回归，我们只有一个特色，称之为Xi，没有任何下标，当我们有n个特征时，这是一个新的符号，其中n是两个或更多，我们得到梯度下降的更新规则，得到右侧的公式，这个公式实际上是成本j对w的导数，j对右边W1的导数公式，看起来与左边一个功能的情况非常相似，误差项仍然取X-目标y的预测f，一个区别是w和x现在是向量，就像左边的w变成了右边的W，这只是对于j=1的多元线性回归，我们有j从1-n,所以我们将更新参数W1W2一直到Wn，然后像以前一样，我们将更新B，如果你实现了这个，你得到了多元回归的梯度下降，在继续之前，这就是多元回归的梯度下降。

线性回归求w和b的另一种方法，这个方法叫做法方程。然而，梯度下降是最小化成本函数的一个很好的方法，求w和b，还有一种算法只适用于线性回归，你看到的其他算法，在这个求解W和B的专门化中，另一种方法不需要迭代梯度下降算法，称为法方程法。事实证明，使用高级线性代数库是可能的，在一个目标中只求解w和b，而不迭代。

法方程法的一些缺点首先是与梯度下降不同，这并不能推广到其他学习算法。法方程法也相当慢，如果特征数n很大，几乎没有机器学习实践者应该自己实现正态方程方法，但是如果使用的是一个成熟的机器学习库，并调用线性回归，有可能在后端，它将用这个来求解w和b，所以如果你在面试中听到正态方程这个词就是这个意思。不要担心正态方程如何工作的细节，一些机器学习库可能会在后端使用这种复杂的方法，求解W和B，但对于大多数学习算法来说，包括如何实现线性回归，梯度下降。多元线性回归可能是当今世界上使用最广泛的学习算法。

原文地址：https://blog.csdn.net/yn3535_/article/details/143018423

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：SpringSecurity 捕获自定义JWT过滤器抛出的异常
下一篇：HTML（六）超链接

无极低码课程【mysql windows下安装要点】
MySQL 是世界上最流行的开源关系型数据库管理系统之一。本教程将指导您在Windows操作系统上安装MySQL 5.7。
阅读更多2024-10-18
FLINK SQL时间属性
在Flink SQL中，时间属性是一个核心概念，它主要用于处理与时间相关的数据流。Flink支持三种时间属性：事件时间（event time）、处理时间（processing time）和摄入时间（i
阅读更多2024-10-18
爬虫逆向-js进阶(续写，搭建网站)
【代码】爬虫逆向-js进阶(续写，搭建网站)
阅读更多2024-10-18
kafka入门
Apache Kafka最初由LinkedIn开发并于2011年开源，主要解决大规模数据的实时流式处理和数据管道问题。kafka是一个分布式的发布-订阅消息系统，可以快速地处理高吞吐量的数据流，并将数
阅读更多2024-10-18
PHP 表达式 Exception::__toString
在PHP中，Exception类是所有异常的基类。它提供了一套标准的异常处理机制，包括捕获异常、获取异常信息、处理异常等。Exception类本身及其子类（如等）都可以被抛出以表示不同类型的错误情况。
阅读更多2024-10-18
java面试-每日随机(1014)
当从节点符合故障转移资格后，更新触发故障选举的时间，只有到达该时间后才能执行后续流程，这里之所以采用延迟触发机制，主要是通过对多个从节点使用不同的延迟选举时间来支持优先级问题。故障节点变为客观下线后，
阅读更多2024-10-18
每天花2分钟学数字化转型，第三讲：数智化
智能化是指事物在网络、大数据、物联网和人工智能等技术的支持下(数字化产生的结果)，所具有的能满足人的各种需求的属性(系统直接进行决策，并指挥相应的部门执行决策)。通俗一点来说，智能化将决策机制模型化后
阅读更多2024-10-18
JVM类加载机制，一文搞懂相关细节！
初始化：执行类构造器阶段，由编译器自动收集类中所有类变量的赋值动作和静态代码块，通常这个阶段才是真正的为变量赋值正确的初始值，这是类加载的最后阶段，只有在类被主动使用时才会触发初始化。在 Java 虚
阅读更多2024-10-18
K8s快速入门
原来我们的应用程序需要访问数据库的话，一般的做法是将数据库的地址和端口等连接信息写到配置文件或者环境变量中，然后在应用程序中读取这些配置信息，这样配置信息就和应用程序耦合在一起了，当数据库的地址或者端
阅读更多2024-10-18
Leetcode 1489. 找到最小生成树里的关键边和伪关键边
给你一个 n 个点的带权无向连通图，节点编号为 0 到 n-1 ，同时还有一个数组 edges ，其中 edges[i] = [fromi, toi, weighti] 表示在 fromi 和 toi
阅读更多2024-10-18

机器学习—多元线性回归的梯度下降法

相关文章