《机器学习by周志华》学习笔记-线性模型-02

🕗 发布于 2024-04-21 14:35 机器学习 学习笔记线性代数数学建模

1、对数几率回归

1.1、背景

上一节我们考虑了线性模型的回归学习，但是想要做分类任务就需要用到上文中的广义线性模型。

当联系函数 $g(\cdot )$ 连续且充分光滑，考虑单调可微函数 $g(\cdot )$ ，令：

$y=g^{-1}(w^{T}+b)$

1.2、概念

找一个单调可谓函数 $g(\cdot )$ ，将分类任务的真实标记 $y_{i}$ 与线性回归模型的预测值 $f(xi)$ 联系起来，也叫做「Heaviside函数」。

在二分类任务中，输出的真实标记 $y_{i}\in \left \{ 0,1 \right \}$ ，而线性回归模型产生的预测值 $f(x)=w^{T}+b$ 是实数值。于是我们将 $f(x)$ 转化为0、1值。最理想的情况就是「单位阶跃函数（unit-step function）」，如下所示：

$y=\begin{cases} 0, \text{ f(x)< 0 } \\ 0.5, \text{ f(x)= 0 } \\ 1, \text{ f(x)> 0 } \end{cases}$

若 $f(x)> 0$ ,就判为正例；

若 $f(x)< 0$ ,就判为反例；

若 $f(x)= 0$ ,则可任意判别；

如下图所示（红色部分）

黑色部分函数，则称为「对数几率函数」，简称「对率函数」。

从上图可以看出，「单位阶跃函数（unit-step function）」（2条红线+一个点）不连续，因此不能直接用做 $g^{-1}$ ,我们可以在上图中，用「单位阶跃函数」的「替代函数」（对率函数）来用作 $g^{-1}$ 。并且需要该函数单调可微。可得出：

$g^{-1}=y=\frac{1}{1+e^{-f(x)}}=\frac{1}{1+e^{-(w^{T}+b)}}$

Sigmoid函数：

Sigmoid函数即S形函数。「对率函数」是Sigmoid函数最重要的代表。我们将会在后面「神经网络」将看到他在神经网络中的重要作用。

综上所述，「对率函数」将f(x)转化为一个接近0或1的y值。并且值得范围在f(x)=0附近变化斜率高。

上述式子可以变化为：

$ln\frac{g^{-1}}{1-g^{-1}}=w^{T}+b$

将 $g^{-1}$ 视作样本x为正例的可能性。则 $1-g^{-1}$ 视作样本x为负例的可能性。两者的比值：

$\frac{g^{-1}}{1-g^{-1}}$

称为「几率（odds）」

几率（odds）:

Odds=P/(1-P)

Odds（几率）的计算公式为Odds=P/(1-P)，这里的P是指某个事件发生的概率。

Odds是用来表示一个事件发生与不发生的比例，当P=0.5时，Odds=1，当P=0，则Odds趋向于无穷大，反之，当P=1，则Odds趋向于0。

对几率（odds）取对数，则得到了「对数几率（log odds）」,也叫做logit。如下表示：

$ln\frac{g^{-1}}{1-g^{-1}}$

上述式子，有文献译为「逻辑回归」。但中文「逻辑」与logisitic和logit的含义较大，此处作者翻译为「对数几率回归」，简称「对率回归」。

因为 $ln\frac{g^{-1}}{1-g^{-1}}=w^{T}+b$ 中的 $w^{T}+b=y$ ，故我们可以得出：

该等式左边是：线性回归模型的预测结果

而等式右边是：该模型的真实标记 $yi$

因此，我们得出的公式结果，实际上就是在用线性回归模型的预测结果，去逼近真实标记 $yi$ 的对数几率。所以其对应的模型称为「对数几率回归」。

需要注意的是，它的名字中虽然有回归，但实际是却是一种分类学习方法。其优点如下：

他是直接对分类可能性进行建模，无需事先假设数据分布，这样就避免分布不准确所带来的问题。

它不仅是预测出「类别」，而是可得到近似概率预测，这对许多需利用概率辅助决策的任务很有用。

此外，对数函数是任意阶可导的凸函数，有很好的数学性质，现有的许多数值优化算法都可直接用于求取最优解。

1.3、求解

根据1.2的概念，本章主要求解公式中的w和b。如果我们将上述式子中的 $g^{-1}$ 视为「后验概率」估计 $p(y=1|x)$ ,，则上述式子可以重写为：

原文地址：https://blog.csdn.net/vanilla698/article/details/137687190

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Enhance Your Java and PHP
下一篇：Ubuntu 20.04和Ubuntu 16.04 集成显卡支持opencl说明

info 命令：查看命令手册
在 Linux 系统中，可以使用man 查看普通的帮助手册。还可以使用info 命令阅读 Info 格式的文档。info 文档的特点：大量使用超链接，通过方向键将光标移动到链接的文字，按下回车
阅读更多2024-09-20
【内网渗透】最保姆级的春秋云镜Privilege打靶笔记
在xradmin/ruoyi-admin/src/main/resources/application-druid.yml找到Oracle的账密。internal-secret/credentials
阅读更多2024-09-20
【PyTorch】深入浅出PyTorch
Why learn PyTorchPyTorch日益增长的发展速度与深度学习时代的迫切需求构建知识体系熟悉知识分布对应查缺补漏
阅读更多2024-09-20
uniapp快速入门教程，内容来源于官方文档，仅仅记录快速入门需要了解到的知识点
官方文档：https://uniapp.dcloud.net.cn/必需技术：uniapp、vuejs 3、ES6及以上常用语法、pinia、css、scss‌‌ES6（‌ECMAScript 6）是
阅读更多2024-09-20
卷积和add、sub、mean等的转换
1的卷积，那么结果的大小为500。
阅读更多2024-09-20
搜维尔科技：OptiTrack采集到的平衡数据，并对人形机器人进行编程，可以确保机器人的动作精度和准确性
2.反馈与调整：将实时跟踪得到的机器人运动数据与预设的运动轨迹或目标动作进行对比，发现偏差后及时反馈给机器人的控制系统。2.路径规划：基于OptiTrack提供的环境信息和机器人的当前位置、目标位置等
阅读更多2024-09-20
Vue2+vue-office/excel 实现在线加载Excel文件预览
Vue2+vue-office/excel 实现在线加载Excel文件预览
阅读更多2024-09-20
第十一章【后端】商品分类管理微服务（11.5）——增强响应
这样，理论上已经实现了我们所想要的统一后端响应格式了，但是我们每写一个接口都要调用。结构，造成不一致，因此我们需要将响应格式统一起来，定义一个统一的标准响应格式。在前后端分离的开发模式下，我们一般会统
阅读更多2024-09-20
大文件编辑器(QT)
大文件编辑器， QSciscintilla, QsciLexerCPP
阅读更多2024-09-20
服务监控插件全览：提升微服务可观测性的利器
通过以上介绍，我们可以看到 New Relic 是一个功能全面、性能优异的监控工具，适用于各种分布式系统的监控需求。通过以上介绍，我们可以看到 Wavefront 是一个功能全面、性能优异的监控工具，
阅读更多2024-09-20

《机器学习by周志华》学习笔记-线性模型-02

1、对数几率回归

1.1、背景

1.2、概念

1.3、求解

相关文章