支持向量机SVM——基于分类问题的监督学习算法

🕗 发布于 2024-11-16 07:55 支持向量机算法 机器学习 学习笔记

支持向量机（SVM，Support Vector Machine）是一种常用于分类问题的监督学习算法，其核心思想是通过寻找一个最佳的超平面来将不同类别的数据点分开，从而实现分类。支持向量机广泛应用于模式识别、文本分类、图像识别等任务。

基本概念

决策超平面：在一个特征空间中，假设我们有一个二维数据集。通过绘制样本点及其对应的标签，我们希望找到一个直线（在二维空间中，这个超平面是线；在三维或更高维空间中，它是一个平面）来分隔这些数据点。对于SVM来说，我们不仅仅关心能分开数据点的任何一条直线，而是希望找到一条具有最大间隔的直线，间隔是指从直线到最近的数据点的距离。
最大间隔： SVM的目标是通过最大化“间隔”来提高模型的泛化能力。间隔定义为从超平面到最近的训练样本点的距离，最近的点称为支持向量。最大化间隔可以帮助模型更好地分类新的、未见过的数据点。
支持向量：支持向量是位于边界上，或距离边界最近的数据点。支持向量在训练过程中起着决定性作用，因为它们直接影响超平面的定义。
线性可分问题：当数据集是线性可分的，即可以找到一个超平面把不同类别的点完全分开时，SVM会寻找那个最大化间隔的超平面。
线性不可分问题：在现实中，数据集往往是线性不可分的。在这种情况下，SVM通过引入核函数将数据映射到更高维的特征空间，使得在高维空间中数据变得线性可分。

线性SVM原理步骤

1、优化问题

假设我们有一个二分类问题，数据集包含 n 个样本，每个样本 $x_{i} \epsilon \mathbb{R}^{d}$ （这个表示xi是一个d维向量，属于d维实数空间），标签 yi∈{−1,+1}。我们希望找到一个超平面，用方程 $w^{T}x+b=0$ 来表示，其中：

w 是超平面的法向量
b 是超平面的偏置。

我们的目标是通过最大化间隔来找到最优的超平面。由于超平面到支持向量的距离为 $\frac{1}{\left \| w \right \|}$ ，

因此我们的优化问题可以转化最小化问题为：

$min\frac{1}{2}\left \| w \right \|^{2}$

同时要满足约束条件：

$y_{i}(w^{T}x_{i}+b)\geqslant 1$ ，对于所有的 i = 1,2, ... , n

这个约束条件确保了每个样本点都被正确分类，并且距离超平面至少有一个单位的间隔。

2、对偶问题

为了通过拉格朗日乘子法来求解这个优化问题，我们构建拉格朗日函数：

$L(w,b,\alpha )=\frac{1}{2}\left \| w \right \|^{2}-\sum_{i=1}^{n}\alpha _{i}[y_{i}(w^{T}x_{i}+b)-1]$

其中， $\alpha _{i}$ 是拉格朗日乘子。

通过对 w 求偏导数并令其为零，可以得到最优的 w，并计算出 b ，从而得到最终的决策超平面。

3、最终的决策函数

最终的决策函数是：

若 f(x) >= 0 ，则预测该类别为 +1 类，否则为 -1 类。

非线性SVM基本原理

当数据不是线性可分时，SVM通过引入核函数将数据映射到高维空间，使得在这个高维空间中数据变得线性可分。

1、非线性原问题：

约束条件：

其中， ϕ(x) 是一个映射函数，用于将一个原始数据映射到高维，变成高维的数据。

举个例子讲解映射函数ϕ(x)

比如，有以下映射函数：

样本 x1=(1,1)映射到 $(1, 1, \sqrt{2})$

样本 x2=(2,−1) 映射到 $(4, 1, -2\sqrt{2})$

通常，直接使用映射后的数据点来求解优化问题通常是不可行的，因为我们并不直接知道映射函数 ϕ(x)的显式形式。然而，通过使用核函数，我们可以通过以下方式计算数据点的内积，进行隐士计算：

2、构造拉格朗日函数

拉格朗日函数其实等价于将约束条件也整合到问题的目标函数中。

为了将约束引入优化问题，我们使用拉格朗日乘子法。针对每个约束 yi(w⋅ϕ(xi)+b)≥1−ξi，引入一个拉格朗日乘子 αi≥0 ，表示每个约束条件的惩罚，并构造拉格朗日函数：

为了消除拉格朗日乘子引入的约束，我们对 w、b 和 ξi 求偏导数，并将其置为零，得到极值条件。

先将 w 代入拉格朗日函数L的部分:

得到：

最后将w以外剩余的两个极值代入拉格朗日函数L，我们得到目标函数：

3、对偶问题的最优化目标

最终的对偶问题可以写成：

通过对偶问题，我们能通过核函数有效处理高维空间的问题，而无需显式地计算映射 ϕ(xi)

通过求解对偶问题（过程复杂，就不写了），我们可以求解出最优的 αi ，接着求解出 w :

再求出 b

4、分类决策函数

对于原问题，SVM的最终分类决策函数是：

由于映射函数 ϕ(xi) 难以求解，我们利用核函数，根据对偶问题，我们得到最终分类决策函数：

若 f(x) >= 0 ，则预测该类别为 +1 类，否则为 -1 类。

常见的核函数

# 内容来源于各渠道整理，结合了自己的见解。若对大噶有帮助的话，希望点个赞支持一下叭！

# 文章如有错误，欢迎大噶指正！

原文地址：https://blog.csdn.net/weixin_74268817/article/details/143782616

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：20.UE5UI预构造，开始菜单
下一篇：鸿蒙生态下的安全隐私保护：打造用户信任的应用体验

Java项目:校园宿舍管理系统(优质版)(Springboot3+Maven+Mybatis Plus+Vue3+ Element Plus+Mysql)
Springboot3+Maven+Mybatis Plus+Vue3+ Element Plus+Mysql 开发的前后端分离的校园宿舍管理系统。
阅读更多2024-11-16
IntelliJ IDEA新建项目或导入未识别为maven解决
1.首先，我的情况是我新建了一个springboot项目，然后选择类型是Maven但是建立后不是maven项目。当然，前提是你的maven已经在idea上做好配置了。2.打开项目后，从File --》
阅读更多2024-11-16
Gin HTML 模板渲染
Gin HTML模板入门
阅读更多2024-11-16
未来的车网互动如何重塑我们的城市生活
设想一下，在一个寒冷的冬日，你的车辆通过车网互动得知前方桥梁可能结冰，它会自动降低速度，并提醒你注意驾驶安全。公众的参与同样重要，只有当越来越多的车辆加入到车网互动系统中，才能真正发挥其潜力，提高整个
阅读更多2024-11-16
人工智能技术的应用前景及其对生活和工作方式的影响
人工智能技术的应用前景广阔，它不仅在医疗、企业和日常生活中带来了显著的变化，还将继续推动社会的创新和发展。面对 AI 技术带来的机遇和挑战，我们需要共同努力，确保技术的发展能够造福人类社会，创造一个更
阅读更多2024-11-16
《AI技术，让生活更简单》
想象一下，你回到家，灯自动亮了，空调调到你喜欢的温度，冰箱告诉你牛奶快没了，甚至还能帮你预约超市送货。这不是科幻电影，这就是AI技术正在做的事情。
阅读更多2024-11-16
sychronized锁
sychronized 关键字能成为锁的原因，是因为它提供了**内置锁（Intrinsic Lock）**机制，用于线程同步，确保同一时刻只有一个线程能够访问被标记为 synchronized 的代码
阅读更多2024-11-16
SpringBoot 2.2.10 无法执行Test单元测试
同样的Idea版本，现有的项目却可以执行，按照C老师的提示增加对junit5的引用支持，依然没有，StackOverflow上也是提示增加依赖，依赖加完之后执行报错一个 EnginListener N
阅读更多2024-11-16
springMVC 全局异常统一处理
进⾏异常处理，具有集成简单、有良好的扩展性、对已有代码没有⼊侵性等优点，但该⽅法仅能获取到异常信息，若在出现异常时，对需要获取除异常以外的数据的情况不适⽤。Unchecked Exception，⽽
阅读更多2024-11-16
thinkphp6配置多应用项目及多域名访问路由app配置
ThinkPHP 多应用模式初探
阅读更多2024-11-16