2024-11-18 学习人工智能的Day28 线性回归

🕗 发布于 2024-11-19 17:27 学习 人工智能 线性回归

线性回归

线性回归是统计学和机器学习中的一种基本预测模型，用于分析和建模目标变量（连续型数据）与一个或多个自变量（解释变量）之间的关系。

线性回归概述

线性回归模型假设目标变量 y 与自变量 X 之间存在线性关系。这种关系可以用以下公式表示：

$\beta_0 + \beta_1 X_1 + \beta_2 X_2 + \ldots + \beta_n X_n + \epsilon$
其中：

y 是目标变量。
X_1, X_2, \ldots, X_n 是自变量。
β_0, β_1,β_n 是回归系数，需要通过数据估计。
ε 是误差项，表示模型无法解释的随机变异。

线性回归类型

简单线性回归：只有一个自变量和一个因变量。
多元线性回归：包含两个或更多自变量。

损失函数

线性回归通常使用最小二乘法来估计模型参数，即最小化实际观测值和模型预测值之间的平方差之和。损失函数定义为：

$\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$
其中：

n 是样本数量。
y_i 是第 i 个观测值。
y_i是模型预测值。

参数估计

最小二乘法通过求解以下方程来估计参数：

$\frac{\partial \text{MSE}}{\partial \beta_j} = 0$
这通常通过矩阵运算实现：

$\hat{\beta} = (X^T X)^{-1} X^T y$
其中：

X 是设计矩阵，包含自变量的值。
y 是目标变量的向量。
β 是估计的参数向量。

梯度下降法

梯度下降是一种优化算法，用于最小化损失函数。在每次迭代中，参数按照梯度的反方向更新：

$\beta^{(t+1)} = \beta^{(t)} - \alpha \nabla_\beta \text{MSE}(\beta^{(t)})$
其中：

α是学习率。
β 是损失函数相对于参数的梯度。

正则化

为了防止过拟合，线性回归模型可以加入正则化项，如岭回归（L2正则化）和Lasso回归（L1正则化）：

岭回归：
$\text{Loss} = \text{MSE} + \lambda \sum_{j=1}^{n} \beta_j^2$
Lasso回归：
$\text{Loss} = \text{MSE} + \lambda \sum_{j=1}^{n} |\beta_j|$

其中 λ 是正则化强度参数。

应用

线性回归广泛应用于各种预测任务，如房价预测、股票价格分析、销售预测等。尽管线性回归模型简单，但它提供了对数据关系的基本理解，并且可以作为更复杂模型的基准。

线性回归模型的实现和应用通常依赖于统计软件或机器学习库，如Python的scikit-learn库，它提供了简单而强大的接口来训练和评估线性回归模型。

最后介绍一下sklearn库中的接口

import numpy as np
import matplotlib.pyplot as plt

w = np.linspace(-10,20,100)
# print(w)
def loss(w):
     return (w-3.5)**2-4.5*w+10
def dloss(w):
    return 2*(w-3.5)-4.5

plt.plot(w,loss(w)) # 当该直线与x轴相交，表示损失为0，拟合曲线与所有已知点重合，
# 且该曲线无法出现小于0的值，因为该曲线是由均方误差算的


# 梯度下降
# 学习率
learning_rate = 0.01
# 初始化一个w值
np.random.seed(1)
w = np.random.randint(-10,20) # 随机给一个w值：-5
e = loss(w) # 初始化的w为-5时的loss值
x = [w]
y = [e]


# 用循环来多级下降
for i in range(100):
    w = w-learning_rate*dloss(w)
    e = loss(w)
    x.append(w)
    y.append(e)
    
# 单次下降
# # 第一次梯度下降
# w = w-learning_rate*dloss(w)
# e = loss(w)
# x.append(w)
# y.append(e)
# # 第二次梯度下降
# w = w-learning_rate*dloss(w)
# e = loss(w)
# x.append(w)
# y.append(e)
# # 第三次
# w = w-learning_rate*dloss(w)
# e = loss(w)
# x.append(w)
# y.append(e)


plt.scatter(x,y)
plt.show()

原文地址：https://blog.csdn.net/ctrey_/article/details/143864341

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：基于 OpenCV 和 dlib 方法进行视频人脸检测的研究
下一篇：介绍一下strncmp(c基础)

鸿蒙进阶篇-TextInput&TextArea和Checkbox
在鸿蒙开发中，TextInput 用于单行文本输入，TextArea 用于多行文本输入，Checkbox 则是用于多项选择的复选框组件。
阅读更多2024-11-21
MySQL45讲第二十六讲备库为什么会延迟好几个小时？——阅读总结
在MySQL数据库的主备架构中，备库延迟是一个需要重点关注的问题。它可能影响系统的可用性和数据的一致性，尤其是在主库压力较大时，备库延迟可能达到数小时甚至永远无法追上主库。今天，我们将深入探讨MySQ
阅读更多2024-11-21
快速简单的视频下载器——lux
在学习之余，发现了一个简单并且高效的视频下载器lux,能够帮你快速且高效的下载文件（不仅仅是视频可以），所以写了一篇博客分享lux的相关内容这个简单并且高效的视频下载器lux，一定会提高你的下载效率的
阅读更多2024-11-21
XGBOOST、LightGBM、CATBoost
本文介绍了三种 GBDT 的优化算法，可以根据实际情况进行选择。
阅读更多2024-11-21
【JAVA】Java基础—面向对象编程：常用API与数据结构—字符串、数组的使用
在Java编程中，字符串和数组是两个非常基础且重要的数据结构。它们在日常开发中无处不在，理解它们的使用及其背后的理论知识是成为一名合格Java开发者的必经之路。：可以将字符串比作一本书的章节。每个章节
阅读更多2024-11-21
Docker-Compose 快速部署安装 Nginx 或其他应用
测试部署的 Nginx 是否运行正常，可以在浏览器中访问 Nginx 所在的 IP 或端口，确保能够看到默认的 Nginx 页面。（如果你安装的是 Docker CE）。将下载的 Docker-Com
阅读更多2024-11-21
微信小程序申请getlocation权限
2、如果小程序没有导航功能。可以使用wx.openLocation写一个导航页面功能，以便进行权限申请。所以需要申请getlocation权限的开启。体验版没有申请开启不影响使用，但是上线提审必须申请
阅读更多2024-11-21
(RK3566驱动开发 - 2）.IIC驱动
【代码】(RK3566驱动开发 - 2）.IIC驱动。
阅读更多2024-11-21
04 搭建linux驱动开发环境
虽然 petalinux 功能很全面，但是其编译速度较慢，不适用于驱动调试阶段（因为驱动调试阶段会频繁修改驱动模块、内核、设备树等），因此本章将采用分步编译的方式来编译启动开发板所需要的各种镜像文件，
阅读更多2024-11-21
2025蓝桥杯（单片机）备赛--扩展外设之NE555的使用及定时器1的详细讲解（十）
超详细的定时器555讲解
阅读更多2024-11-21