【线性回归模型】

🕗 发布于 2024-09-20 07:08 线性回归决策树 机器学习

线性回归模型

创建一些带标签的数据集𝐷 = {(𝒙1, 𝑦1) , (𝒙2, 𝑦2 ), … , (𝒙𝑚, 𝑦𝑚) }
x为特征，映射到对应的标签y，再引入偏置b

线性回归模型的函数表达式可以用下面的式子
来表达：
𝑓(𝑥) = 𝑤1𝑥1 + 𝑤2𝑥2 + ⋯ + 𝑤𝑛𝑥𝑛 + 𝑏

对比函数（误差函数）

在这里插入图片描述
即将参数模型预测出的y与真实的y做对比，来调节参数和权重，以及偏置使得误差最小
即找到一些w使得J(x)最小甚至等于0
Loss值计算公式：

f(x)就是线性模型预测值，y为真实值，这里把b省略掉了便于计算。

最小二乘法

这里loss值（即损失值）的函数为开口向上的二次函数，那一定有个最小值
在这里插入图片描述
就是对w求导，导数为0时取得极小值，w=y/x时loss值最小

最小二乘法向量形式

将参数𝑏纳入到矩阵𝒘中，此时数据特征矩阵𝒙则为：
在这里插入图片描述
矩阵𝒘为：
得到线性回归模型的向量表达式如下式所示𝑓(𝑿) = 𝑿w

求解使得loss最小

还是仿造刚刚简易的最小二乘法求这个较复杂带矩阵表达式的最小loss值
很显然𝒙和𝒘都是一个矩阵，利用最小二乘法对这个矩阵求最优的𝒘矩阵参数。
计算的步骤如下所示

$J(\omega)=\frac{1}{2}(f(x)-Y)^2$
这个 $\frac{1}{2}$ 只是方便之后计算，注意这里Xw是两个矩阵
$J(\omega)=\frac{1}{2}(Xw-Y)^2$
在线性代数里可写为它的转置乘以它本身 $J(\omega)=\frac{1}{2}(Xw-Y)^T(Xw-Y)$
转置拿进去
$J(\omega)=\frac{1}{2}(X^Tw^T-Y^T)(Xw-Y)$
$=\frac{1}{2}(X^Tw^TXw-Y^TXw-X^Tw^TY+YY^T)$
我们求 $J(\omega)$ 的导数为0时有loss的极小值
好，来求一下w的偏导数
$\frac{\partial J(\omega)}{\partial w}=\frac{1}{2}(\frac{X^Tw^TXw}{\partial w}-\frac{Y^TXw}{\partial w}-\frac{X^Tw^TY}{\partial w})$
常数项 $YY^T$ 为0，看看对矩阵求导的公式知识点吧，如在这里插入图片描述
套公式则
$\frac{\partial J(\omega)}{\partial w}=\frac{1}{2}(2XX^Tw-X^TY-X^TY)$
$\frac{\partial J(\omega)}{\partial w}=XX^Tw-X^TY)$
令 $\frac{\partial J(\omega)}{\partial w}=0$ 则 $XX^Tw-X^TY=0$
$w=(XX^T)^{-1}X^TY$
但是 $XX^T)^{-1}$ 大多数时候是无解的，所以最小二乘法多数情况下不能来求导得出loss最小值
于是梯度下降法就上线了

原文地址：https://blog.csdn.net/qq_43094272/article/details/142356589

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：C# 从字符串中分离文件路径、文件名及扩展名
下一篇：介绍一些免费的 html 5模版网站和配色网站

web前端开发--盒子属性
学院介绍
阅读更多2024-11-18
深度学习基础—Seq2Seq模型
decoder网络和编号4的语言模型几乎一模一样，机器翻译模型其实和语言模型非常相似，不同在于语言模型总是以零向量开始，而encoder网络会计算出一系列向量来表示输入的句子。假设输入猫咪图片，经过预
阅读更多2024-11-18
【第三章】Kubernetes资源与对象
文章目录1. Kubernetes资源介绍1.1 Pod1.2 Deployment1.3 Service1.4 Namespace2. Kubernetes资源实践2.1 部署应用2.2 访问应用2
阅读更多2024-11-18
SRT拥塞控制分析
在慢启动阶段，发送端会逐渐增加发送速率，直到网络出现丢包，这时会触发拥塞控制机制，减少发送速率。在拥塞控制中，如果网络出现丢包，发送端可能会增加数据包发送间隔，以减少网络拥塞。：拥塞窗口的大小，用于控
阅读更多2024-11-18
小红书内容推荐算法开发：利用API打造个性化用户体验
小红书，作为国内领先的内容分享社区，其丰富的用户生成内容（UGC）和独特的社区氛围，为推荐算法的开发提供了肥沃的土壤。通过小红书API获取的数据，我们可以构建用户兴趣画像和内容特征，进而实现个性化推荐
阅读更多2024-11-18
详解八大排序（一）------（插入排序，选择排序，冒泡排序，希尔排序）
在日常生活中，我们常常要将各种各样的数据进行排序，例如我要将班上的学生按照数学成绩从大到小的排序，像这种一般情况，编译器自带的sort函数就能满足我们的要求。但是，假如我要将班上姓刘的学生按照数学成绩
阅读更多2024-11-18
量化交易系统开发-实时行情自动化交易-3.4.3.2.期货交易数据
交易数据（Trade Ticks）是进行高频交易策略和市场情绪分析的核心数据之一，通过获取逐笔交易的数据，交易者可以识别大资金动向、市场参与者的行为，以及短时间内的市场动态。以下是通过 Python
阅读更多2024-11-18
Rust：AtomicI8 还是 Mutex＜u8＞?
提供的原子操作（如加载、存储等）在硬件层面得到支持，这些操作是不可分割的，即一旦开始执行，就不会被其他线程的操作打断。如果需要在多个线程之间安全地传递复杂的数据结构或进行复杂的同步操作，那么可能需要考
阅读更多2024-11-18
小程序-基于java+SpringBoot+Vue的智能小程序商城设计与实现
智能小程序商城是一个基于Java和Spring Boot框架开发的电子商务平台，利用微信小程序技术提供便捷的购物体验。系统支持商品浏览、购物车管理、订单处理、用户信息管理等功能，旨在为用户打造一个简洁
阅读更多2024-11-18
华为Ensp模拟器配置OSPF路由协议
开放式最短路径优先 (OSPF) 协议深度解析简介开放式最短路径优先（Open Shortest Path First, OSPF）是一种内部网关协议（IGP），用于在自治系统（AS）内进行动态路由选
阅读更多2024-11-18