【机器学习入门】(1) 线性回归算法

🕗 发布于 2024-11-12 13:07 机器学习 算法线性回归

学习目标：

线性回归是一种基本的统计学习方法，主要用于分析一个或多个自变量与因变量之间的线性关系。以下是关于线性回归的一些关键点：线性回归的四要素：
（1）假设(hypothesis)；（2）模型参数(params)；（3）代价函数(loss)；（4）目标(Goal)；

1.概念含义：

线性回归模型假设因变量和自变量之间存在线性关系，即可以通过一条直线（一维）或一个平面（多维）来近似表示这种关系。

在这里插入图片描述

2.数学表达式-假设(hypothesis)：

在这里插入图片描述

3.参数(params)：

其中，X可能是线性相关的特性（多元一次函数），公式中的参数W就是我们得到的算法模型，（主要就是为了训练得到model的parameter）。
有了好的参数，这样就会然后我们的训练数据更好的去拟合模型。
这样对于一个新的X(n维，多个指标)，可能更好的得出准确的y_predict。

4.代价函数(loss)：

代价函数也叫均方误差函数，是我们预测模型（Θ-n维，多个指标）计算出的y_pre与y_true的比较。
在这里插入图片描述

5.目标(goal)：

目标就是用4中等式右面的均方误差函数求出最优的参数模型
那么如何求出最优参数模型呢？如何得到好的参数去更好的拟合新数据呢?
后面就需要引入梯度下降来的到模型最优的参数模型（loss越小越好）。

6.梯度下降（GD）：

7.思考：

代价函数的定义可知是为了得到y_pre与y_true的误差更小，为什么不直接研究如何得到min(|y_pre-y_true|)？
代价函数为什么要平方而不是三次方？四次方？
不能一次方，三次，四次都不可以。因为要后续梯度下降求导，找代价函数的最小值。
如果实际应用中某特征，它表示通过X平方表示，可以使用线性回归吗？
可以的，但是需要特殊操作。需要将X平方的整体代表一个特征（特征处理）。
为什么要乘二分之一？
方便后续梯度下降求导，方便计算

原文地址：https://blog.csdn.net/qq_45973897/article/details/143690730

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Spring Cloud微服务
下一篇：cache写策略操作系统

Python高级编程模式和设计模式
【代码】Python高级编程模式和设计模式。
阅读更多2024-11-15
【代码随想录】刷题记录(29)-用栈实现队列
思路其实很简单，有点像那种小学益智游戏，比如那种给两个箱子，花几步把最下面的砖块搬出来的游戏。这道题其实就是类似这种动作，因为栈是遵循“先入后出”的原则，所以如果要拿出最先入栈stack_in的元素（
阅读更多2024-11-15
Jdbc学习笔记（四）--PreparedStatement对象、sql攻击（安全问题）
在需要用户输入的地方，用户输入的是SQL语句的片段，最终用户输入的SQL片段与我们DAO中写的SQL语句合成一个完整的SQL语句！例如用户在登录时输入的用户名和密码都是为SQL语句的片段！所以，建议大
阅读更多2024-11-15
Redis简介、数据结构、高性能读写、持久化机制、分布式架构
Redis简介、数据结构、高性能读写、持久化机制、分布式架构
阅读更多2024-11-15
扩散模型生成 360度场景
扩散模型生成 360度场景
阅读更多2024-11-15
css文字间距撑满横向距离
【代码】css文字间距撑满横向距离。
阅读更多2024-11-15
Python常用魔术方法（学习笔记）
Python中常用魔术方法的使用。
阅读更多2024-11-15
如何在 Ubuntu 上安装 RStudio IDE（R语言集成开发环境） ?
RStudio 是一个功能强大的 R 语言集成开发环境(IDE)，R 是一种主要用于统计计算和数据分析的编程语言。任何从事数据科学项目或任何其他涉及 R 的类似任务的人，RStudio 都可以使您的工
阅读更多2024-11-15
开源对象存储新选择：在Docker上部署MinIO并实现远程管理
开源对象存储新选择：在Docker上部署MinIO并实现远程管理
阅读更多2024-11-15
Hot100 42接雨水
根据题目描述，雨水总和就是蓝色方块加起来的总和。怎么思路很简单，为了不让水溢出，那么两边只能取最短的一截。根据当前柱子所处的位置，算出前面最高的和后面最高的柱子（因为水是流动的），这样求最小的柱子长度
阅读更多2024-11-15