线性分类器全解析：Logistic 回归、Softmax 回归、感知器和支持向量机

🕗 发布于 2024-11-26 17:14 机器学习 深度学习 人工智能 回归

引言

在机器学习中，线性分类器 是一种经典而高效的分类方法，能够在特征空间中寻找一条（或一个超平面）来区分不同类别的数据点。它是现代机器学习模型的基石，同时为许多复杂模型（如神经网络）奠定了理论基础。本文将详细解析四种常见的线性分类器——Logistic 回归、Softmax 回归、感知器和支持向量机（SVM），以帮助读者深入理解其原理、应用及优劣点。

一、Logistic 回归：二分类问题的经典之作

1.1 什么是 Logistic 回归？

Logistic 回归 是一种专注于二分类问题的线性分类器。尽管名字带有“回归”，其本质是分类模型。通过对输入特征进行线性变换，并通过一个 Sigmoid 函数 转化为概率值，最终进行分类决策。

数学表达：
假设输入样本为 x∈Rd，其预测函数为：

其中，σ(z)是 Sigmoid 函数，w和b是模型参数。

1.2 损失函数及优化

Logistic 回归通过最小化 对数似然损失函数 来学习模型参数：

yi∈{0,1} 表示真实类别。
y^i是模型预测的类别概率。

1.3 优点与局限性

优点：
1. 简单高效，适合小规模线性可分的数据。
2. 输出概率值，解释性强。
局限性：
1. 对非线性问题表现欠佳。
2. 特征独立性假设可能导致欠拟合。

实战案例

使用 Python 和 scikit-learn 实现 Logistic 回归：

from sklearn.datasets import make_classification
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 创建数据集
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 训练模型
model = LogisticRegression()
model.fit(X_train, y_train)

# 测试并评估
y_pred = model.predict(X_test)
print(f"Accuracy: {accuracy_score(y_test, y_pred):.2f}")

二、Softmax 回归：多分类的自然扩展

2.1 什么是 Softmax 回归？

当 Logistic 回归扩展到多分类问题时，成为 Softmax 回归。它通过 Softmax 函数将线性变换映射到概率分布，从而支持多类别分类任务。

数学表达：
给定输入 x，类别概率为：

其中，K是类别数，wk和 bk是类别 k对应的参数。

2.2 损失函数及优化

Softmax 回归采用 交叉熵损失：

其中，yik是类别 k的 one-hot 编码。

2.3 优点与局限性

优点：
1. 适用于多分类问题。
2. 模型输出是类别概率分布。
局限性：
1. 仅能处理线性边界。
2. 容易受类别分布不均影响。

实战案例

实现 Softmax 回归：

from sklearn.datasets import make_classification
from sklearn.linear_model import LogisticRegression

# 创建数据集
X, y = make_classification(n_samples=1000, n_features=20, n_classes=3, random_state=42)

# 训练 Softmax 回归
model = LogisticRegression(multi_class='multinomial', solver='lbfgs')
model.fit(X, y)

# 测试分类
y_pred = model.predict(X)
print(f"Accuracy: {model.score(X, y):.2f}")

三、感知器：最早的线性分类器

3.1 感知器的基本概念

感知器（Perceptron） 是一种线性分类算法，由 Rosenblatt 于 1958 年提出。它是神经网络的雏形，使用简单的规则调整权重，直到找到一个分隔类别的超平面。

更新规则：

y 是真实标签，y^是预测标签。
η是学习率。

3.2 优点与局限性

优点：实现简单，收敛速度快。
局限性：
1. 仅适用于线性可分数据。
2. 容易陷入无解状态。

四、支持向量机（SVM）：强大的分类器

4.1 什么是支持向量机？

支持向量机（SVM） 是一种强大的线性分类器，旨在找到一个最大化分类边界的超平面。

数学目标：

4.2 优点与局限性

优点：
1. 能很好处理高维数据。
2. 通过核函数扩展到非线性问题。
局限性：
1. 对大规模数据不适用。
2. 参数调节复杂。

结语

线性分类器简单却强大，适用于从基础到进阶的各种学习场景。Logistic 和 Softmax 回归适合初学者快速入门，而感知器和支持向量机则是理解现代分类器的关键。选择哪种方法取决于数据特征和任务需求，掌握这些方法后，你将拥有更强大的分类工具库！

原文地址：https://blog.csdn.net/xyaixy/article/details/144020299

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【测试工具JMeter篇】JMeter性能测试入门级教程（一）出炉，测试君请各位收藏了！！！
下一篇：英语知识网站开发：Spring Boot框架技巧

《Vue零基础入门教程》第三课：起步案例
当状态值发生变化时, Vue会自动响应变化, 使用新的数据重新渲染视图。
阅读更多2024-11-27
AIGC-----AIGC在虚拟现实中的应用前景
AIGC是一种基于人工智能的内容生成方式，包括文本、图像、音频和视频的生成。而VR是一种通过计算机模拟创造出一种虚拟环境，给用户带来沉浸式体验的技术。AIGC与VR的结合可以使虚拟环境更具动态性和互动
阅读更多2024-11-27
C++设计模式之组合模式实践原则
通过考虑这些重要方面，你可以确保实现的组合模式符合软件设计原则，从而创建出灵活、可扩展、易于维护的系统。
阅读更多2024-11-27
【纪念365天】我的创作纪念日
博主的创作纪念日
阅读更多2024-11-27
第三届航空航天与控制工程国际 (ICoACE 2024)
北京航空航天大学航空科学与工程学院教授，博士生导师，澳大利亚国家优秀青年人才，北京航空航天大学青年拔尖人才。，北京航空航天大学自动化科学与电气工程学院教授，博士生导师，国家级青年人才。，上海大学自动化
阅读更多2024-11-27
uniapp-vue2引用了vue-inset-loader插件编译小程序报错
是node_modules目录的vue-template-compiler和vue依赖包的版本号不一样导致的报错。把vue依赖包改成和vue-template-compiler依赖包一样的版本号。在p
阅读更多2024-11-27
uniapp开发微信小程序笔记8-uniapp使用vant框架
前言：其实用uni-app开发微信小程序的首选不应该是vant，因为vant没有专门给uni-app设置专栏，可以看到目前Vant 官方提供了Vue 2 版本、Vue 3 版本和微信小程序版本，并由
阅读更多2024-11-27
uniapp+vue2+uview2.0导航栏组件二次封装
uniapp+vue2+uview2.0导航栏组件二次封装
阅读更多2024-11-27
【leetcode】动态规划
1. 这道题目没有规定一个数不能重复出现，所以判断前一个数是否存在，得到的下标有多个，要得到最大的子序列，的正整数数组形成序列 arr ，找到 arr 中最长的斐波那契式的子序列的长度。中删掉任意
阅读更多2024-11-27
【设计模式】【创建型模式（Creational Patterns）】之原型模式（Prototype Pattern）
原型模式是一种创建型设计模式，它通过复制现有对象来创建新对象，而不是通过构造函数。这种方式可以提高性能，特别是在对象初始化需要消耗大量资源或耗时较长的情况下。性能提升：通过复制现有对象来创建新对象，可
阅读更多2024-11-27

线性分类器全解析：Logistic 回归、Softmax 回归、感知器和支持向量机

引言

一、Logistic 回归：二分类问题的经典之作

1.1 什么是 Logistic 回归？

1.2 损失函数及优化

1.3 优点与局限性

实战案例

二、Softmax 回归：多分类的自然扩展

2.1 什么是 Softmax 回归？

2.2 损失函数及优化

2.3 优点与局限性

实战案例

三、感知器：最早的线性分类器

3.1 感知器的基本概念

3.2 优点与局限性

四、支持向量机（SVM）：强大的分类器

4.1 什么是支持向量机？

4.2 优点与局限性

结语

相关文章