机器学习04-逻辑回归（python）-02原理与损失函数

🕗 发布于 2024-09-22 04:57 机器学习 逻辑回归 python

1. 逻辑回归概念

逻辑回归（Logistic Regression） 是一种 分类模型，主要用于解决 二分类问题（即分成两类，如是否通过、是否患病等）。逻辑回归的目标是根据输入的特征预测一个概率，这个概率值介于 0 到 1 之间。

逻辑回归与线性回归的关系：

线性回归 是用来预测连续值的（如房价、身高），它输出的是一个具体的数值。
逻辑回归 则是用来预测类别的（如是否通过考试），它通过一个线性模型输出一个概率值，表示某个样本属于某一类别的概率。

总结：

线性回归输出数值，而逻辑回归输出概率。
逻辑回归的输出值是 0 到 1 之间的概率，通常我们会设定一个阈值，比如 0.5，将大于 0.5 的归为 1 类，低于 0.5 的归为 0 类。

2. 基本思想

逻辑回归的基本思想，我们可以从以下几个步骤来理解。

Step 1. 线性模型

逻辑回归首先构建的是一个线性模型，即根据输入的特征计算出一个值： $[ f(x) = w^T x + b ]$ 这里的 ( w ) 是权重向量，表示每个特征的重要性；( b ) 是偏置项，帮助调整模型的输出。

这个线性模型的输出 $( w^T x + b )$ 可以是任何实数（正数、负数、大值、小值都有可能）。但是我们不能直接使用这个值进行分类，因为分类任务需要输出的值在 0 到 1 之间，表示概率。

Step 2. Sigmoid 函数

为了将线性模型的输出值转换为 0 到 1 之间的概率值，逻辑回归使用了 Sigmoid 函数： $[ \sigma(z) = \frac{1}{1 + e^{-z}} ]$ 其中， $( z = w^T x + b )$ 。

Sigmoid 函数的作用：

将任意实数映射到 0 到 1 之间。例如，当 ( z ) 非常大时，Sigmoid 函数的输出接近 1；当 $( z )$ 非常小时，Sigmoid 函数的输出接近 0。
输出的概率值 $( \sigma(z) )$ 表示样本属于某一类别（通常为 1 类）的概率。

Step 3. 分类预测

逻辑回归的最终目标是对样本进行分类。我们通常通过设定一个阈值来判断：

如果 $Sigmoid$ 函数的输出概率值大于设定的阈值（如 0.5），则预测该样本属于 1 类；
如果小于阈值，则预测该样本属于 0 类。

总结：逻辑回归首先通过线性模型计算出一个值，然后将该值通过 Sigmoid 函数转换为概率，最后根据设定的阈值进行分类。

3. 逻辑回归的假设函数

在逻辑回归中，假设函数表示的是模型如何通过输入 ( x ) 得到输出的概率值。假设函数如下： $[ h_\theta(x) = \sigma(w^T x + b) ]$ 其中：

$( w^T x + b )$ 是输入特征的线性组合；
$( \sigma(z) )$ 是 Sigmoid 函数，用来将线性模型的输出转换为概率值。

通过这个假设函数，我们可以将任何输入特征转换为一个概率值，这个概率值用于表示样本属于某一类的可能性。

4. 逻辑回归的预测过程（PPT中的例子）

看PPT中的例子，假设有一组样本输入特征，逻辑回归的预测过程可以总结为以下几个步骤：

输入样本特征：如一个人的年龄、体重、是否吸烟等特征。
线性回归计算：根据权重 ( w ) 和偏置 ( b )，计算出线性回归的结果 $( w^T x + b )$ 。
Sigmoid 函数转换：将线性回归的输出通过 Sigmoid 函数转换为概率值。
分类结果：根据设定的阈值，将概率值转换为预测类别。

举例：

假设有一个样本的输入特征为 ( x = [年龄, 体重, 是否吸烟] )，计算过程如下：

使用权重和特征的线性组合计算出 $( f(x) = w^T x + b )$ ，例如输出为 1.5。
通过 Sigmoid 函数将 1.5 转换为概率 $( \sigma(1.5) = 0.82 )$ 。
假设阈值为 0.6，由于 0.82 > 0.6，因此预测该样本属于 1 类。

5. 损失函数：对数似然损失

为了衡量逻辑回归模型的好坏，我们需要计算 损失函数。损失函数表示模型的预测值与真实值之间的差距。逻辑回归使用的损失函数是 对数似然损失函数，又称为 交叉熵损失（Cross-Entropy Loss）。

损失函数的公式如下： $[ L(\theta) = - \sum_{i=1}^{m} [y_i \log(p_i) + (1 - y_i) \log(1 - p_i)] ]$ 其中：

$( y_i )$ 是第 ( i ) 个样本的真实类别（0 或 1）；
$( p_i )$ 是模型预测第 ( i ) 个样本属于 1 类的概率。

损失函数的工作原理：

如果样本的真实标签是 1，那么模型预测的概率值 $( p_i )$ 越接近 1，损失就越小。
如果样本的真实标签是 0，那么模型预测的概率值 $( p_i )$ 越接近 0，损失也越小。

举例：

假设我们有一个样本，它的真实类别是 1，模型预测它的概率为 0.9。根据损失函数公式： [ 损失 = $- (1 \cdot \log(0.9)) = - \log(0.9)$ ] 由于预测的概率接近真实值（1 类），损失较小，说明模型预测得很好。

如果模型预测的概率为 0.1（远离真实值），则损失会非常大，表明模型预测得很差。

6. 逻辑回归的优化：梯度下降

为了让模型能够更好地预测，我们需要找到 最优的参数 ( w ) 和 ( b )。为此，我们使用 梯度下降 来最小化损失函数。

梯度下降的步骤：

计算损失函数的梯度：损失函数对参数 ( w ) 和 ( b ) 的偏导数。
更新参数：沿着负梯度方向更新参数，使得损失函数的值逐渐减小。

更新公式如下： $[ w = w - \alpha \cdot \frac{\partial L}{\partial w} ]$ 这里的 $( \alpha )$ 是学习率，控制每次更新的步长大小。

通过反复进行梯度下降，模型会逐渐找到最优的参数，使得损失函数达到最小值。

总结

逻辑回归的工作原理：逻辑回归通过线性模型输出一个值，并通过 Sigmoid 函数将其转换为 0 到 1 之间的概率值，表示样本属于某一类的概率。
损失函数：使用对数似然损失函数衡量模型预测结果与真实结果的差距，模型通过最小化损失函数来优化自身参数。
梯度下降：通过梯度下降算法更新模型的参数，使损失函数逐渐减小，找到最优的模型参数。

逻辑回归是一种非常直观和基础的分类算法，理解了它的原理可以帮助我们更好地理解其他更复杂的模型。

原文地址：https://blog.csdn.net/weixin_41645791/article/details/142423939

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：MySQL表的增删改查
下一篇：机器学习之实战篇——图像压缩(K-means聚类算法)

JACM23 - A New Algorithm for Euclidean Shortest Paths in the Plane
本文关注的问题为计算几何学中的经典问题，即「在平面上给定一组两两不相交的多边形障碍物，寻找两点之间避开所有障碍物的欧几里得最短路径」，简单理解就是「含多边形障碍物的两点最短路问题」。
阅读更多2024-09-22
linux如何对c++进行内存分析
linux如何对c++进行内存分析
阅读更多2024-09-22
Mina protocol - 体验教程
零知识证明是一种密码学协议，允许证明者在不泄露任何额外信息的情况下，向验证者证明自己知道某个特定的秘密或信息。：zkCircuits 处理初始状态（State0），接受公共和私有输入，生成交易证明（T
阅读更多2024-09-22
springMvc的初始配置
mapper层（另外创建DataSourceJavaConfig ）3.统一放入IOC容器中。controller层。
阅读更多2024-09-22
17【Protues单片机仿真】基于51单片机的太阳能智能谷物翻晒机器人
基于51单片机，避障，低于50CM报警，LED灯亮起，自动翻晒用光敏电阻，光照强度大，电机转动，相当于翻晒粮食，远程控制用按键代替，按下去电机就转动，相当于翻晒粮食，然后光照强度和超声波的距离都在LC
阅读更多2024-09-22
大数据新视界 --大数据大厂之 Node.js 与大数据交互：实现高效数据处理
本文深入阐释 Node.js 与大数据交互。介绍 Node.js 优势，包括高效事件驱动和非阻塞 I/O 及丰富模块生态。阐述与大数据存储系统连接、与处理框架集成方式，通过实时数据分析平台和可视化应用
阅读更多2024-09-22
【C++】—— string模拟实现
学习了string的使用，总感觉了解不是很深厚；自己模拟实现string类来帮助自己理解。
阅读更多2024-09-22
iPhone16，超先进摄像头系统？丝滑的相机控制
iPhone 16将于9月20号正式开售，这篇文章我们来看下iPhone 16 在影像方面，有哪些升级和新feature。芯片：采用第二代 3纳米芯片，A18。摄像头配置：iPhone 16前置：索尼
阅读更多2024-09-22
lora 微调3B模型微调前有5G 量化f16 后最后导出模型容量变小了只有2G了，为什么？
通过量化、LoRA微调、剪枝和存储格式优化等方法的组合，最终导出的模型容量通常会比原始模型显著减少。从5G减少到2G是这些多重因素共同作用的结果。如果你有特定的工具或框架，可以查看其文档了解详细的模型
阅读更多2024-09-22
互联网技术的持续演进：从现在到未来
互联网技术的发展在过去的十年里已经发生了翻天覆地的变化，未来的进展只会更加令人期待。从5G、人工智能到物联网、区块链，各种新兴技术将会继续推动社会的数字化转型。无论是个人、企业还是政府，都将从这些技术
阅读更多2024-09-22