高斯核函数（深入浅出）

🕗 发布于 2024-12-29 08:44 支持向量机 机器学习 人工智能

高斯核函数（Gaussian Kernel），又称径向基核（Radial Basis Function Kernel，RBF Kernel），是机器学习与模式识别中最常用的核函数之一。它通过在高维空间衡量样本间的“相似度”，使得一些线性不可分问题在映射到更高维度后变得可分，从而广泛应用于支持向量机（SVM）、核岭回归、高斯过程等算法中。

定义及数学形式

对于任意两个样本 $\mathbf{x}$ 与 $\mathbf{y}$ ，高斯核函数定义为：

$k(\mathbf{x}, \mathbf{y}) = \exp\left(-\frac{\|\mathbf{x} - \mathbf{y}\|^2}{2\sigma^2}\right)$

有时也会写作：

$k(\mathbf{x}, \mathbf{y}) = \exp\left(-\gamma \|\mathbf{x} - \mathbf{y}\|^2\right)$

其中：

$\|\mathbf{x} - \mathbf{y}\|$ 表示 $\mathbf{x}$ 与 $\mathbf{y}$ 的欧几里得距离；
$\sigma$ 用于控制核函数的宽度，也可用参数 $\gamma = \frac{1}{2\sigma^2}$ 代替；
当 $\mathbf{x} = \mathbf{y}$ 时，核函数取值为 1；两点距离越大，核函数值衰减越快。

主要特点

非线性映射
高斯核可以看作是将样本映射到无穷维的特征空间，从而捕捉到更加丰富的特征关系；在原始空间中线性不可分的问题，可能在映射后的高维空间中被线性分割。
平滑且连续
高斯核呈现出光滑、连续、无界的性质，容易处理大多数实际应用的噪声与不确定性。
调参简洁
高斯核往往只需要关注一个主要超参数 $\sigma$ （或 $\gamma$ ），通过调节它的大小，即可控制核所“感知”的局部与全局范围：
- $\sigma$ 小（ $\gamma$ 大）会使核函数值衰减更快，模型关注更多的局部信息；
- $\sigma$ 大（ $\gamma$ 小）会使核函数值衰减更慢，模型更加平滑，但有时也会导致过度平滑。
应用广泛
在支持向量机（SVM）等核方法中，高斯核通常表现出优于其他核函数的稳定效果。在许多实际场景（如图像识别、文本分类、生物信息学等），高斯核都是默认且常用的选择。

应用示例

以下以支持向量机为例，展示高斯核的应用流程：

数据准备
准备训练数据集 $\{(\mathbf{x}_i, y_i)\}_{i=1}^n$ 。其中 $\mathbf{x}_i \in \mathbb{R}^d$ ， $y_i \in \{+1, -1\}$ 。
选择高斯核
在训练 SVM 时，指定核函数为高斯核：
$k(\mathbf{x}_i, \mathbf{x}_j) = \exp\left(-\gamma \|\mathbf{x}_i - \mathbf{x}_j\|^2\right)$
超参数调优
使用交叉验证等方法，对 $\gamma$ （以及 SVM 中的 C 参数）进行调参，以在训练集和验证集上取得最优表现。
训练与预测
通过核技巧（Kernel Trick）在对偶空间中求解最优决策边界。之后针对新样本 $\mathbf{x}_{\text{new}}$ ，即可计算：
$f(\mathbf{x}_{\text{new}}) = \sum_{i=1}^n \alpha_i y_i \exp\left(-\gamma \|\mathbf{x}_i - \mathbf{x}_{\text{new}}\|^2\right) + b$
若 $f(\mathbf{x}_{\text{new}}) > 0$ ，预测为 $+ 1$ ；反之为 $- 1$ 。

小结

高斯核函数通过指数衰减的方式度量样本间的相似度，实现了对样本的非线性映射，常被用作机器学习中的默认核函数之一。它在处理各种高维和复杂分布数据时都有稳定而优异的表现，尤其适用于支持向量机、核岭回归及高斯过程等方法。通过合理选择 $\sigma$ （或 $\gamma$ ），高斯核能在“过拟合”与“欠拟合”之间找到平衡，帮助模型取得更好的泛化能力。

原文地址：https://blog.csdn.net/weixin_46713695/article/details/144796969

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：“宠物服务的跨平台整合”：多设备宠物服务平台的实现
下一篇：CSS基础入门【2】

微服务架构
Spring Cloud Gateway 是 Spring公司基于Spring5.0，SpringBoot2.0 和 Project Reactor 等技术开发的网关，它旨在为微服务架构提供一种简单
阅读更多2024-12-29
在asp.net webapi项目中将数据库连接字符串写在配置文件中，及Program配置Serilog存放路径以及设置
通过将数据库连接字符串配置到 appsettings.json 文件中，并使用 IConfiguration 接口读取配置，你可以：避免硬编码连接字符串，提高代码的可维护性。轻松更改数据库配置，而无需
阅读更多2024-12-29
《Vue进阶教程》第二十七课：实现侦听对象
如果第一个参数不是副作用函数, 可以将其包装成一个副作用函数。由于并没有触发代理对象的取值操作, 因此不会收集依赖。如果一个对象的某个属性引用自身, 在递归时会死循环。考虑实现一个函数, 遍历访问。如
阅读更多2024-12-29
CF2043b-B. Digits
通过计算，我们发现10^1 mod 7 = 3 10^2 mod 7 = 2 10^3 mod 7 = 6 10^4 mod 7 = 4 10^5 mod 7 = 5 10^6 mod 7 = 1
阅读更多2024-12-29
Git快速查阅
git push -u [source-local-branch] "[remote-name]" 提交本地分支到远程仓库，并在远程仓库中创建该分支。git commit -m '
阅读更多2024-12-29
vue3封装而成的APP ，在版本更新后，页面显示空白
更新之后页面空白，打不开，主要是由于缓存造成的。
阅读更多2024-12-29
STM32-笔记14-排队控制系统
1. 红外传感器检测有人通过并计数；2. 计数值显示在LCD16023. 允许通过时，LED1闪烁，蜂鸣器不响，继电器不闭合；4. 不允许通过时，LED2闪烁，蜂鸣器响，继电器闭合；5. 每次允许通过
阅读更多2024-12-29
STM32高级以太网通讯案例2：搭建TCP服务端
在TCP通讯的时候，客户端必须联系服务器，这样才能实现通讯。服务器与客户端之间的连接是一种长连接，。在STM32上启动一个TCP的服务端，在电脑上用TCP客户端去连接服务端。客户端给服务端发送数据后，
阅读更多2024-12-29
Hyper-V如何将文件复制到虚拟机
此时您已经成功在本地计算机中创建了共享文件夹，然后您需要在Hyper-V中将此网络位置添加到虚拟机。此后将出现一个弹窗，里面有此共享文件夹的路径，请您复制此路径并妥善保存，以便之后能够顺利访问此共享文
阅读更多2024-12-29
深入探索 LangChain 核心模块：构建高效 AI 应用的基石
LangChain 是一个用于开发语言模型驱动应用的框架，它的设计目标是使开发者能够轻松地将语言模型（如 GPT 系列、其他开源语言模型等）集成到各种应用场景中，包括但不限于聊天机器人、智能问答系统、
阅读更多2024-12-29

高斯核函数（深入浅出）

目录

定义及数学形式

主要特点

应用示例

小结

相关文章