【深度学习】通俗理解偏差(Bias)与方差(Variance)

🕗 发布于 2025-01-15 00:11 深度学习 人工智能 集成学习算法 机器学习

在统计学习中，我们通常使用方差与偏差来衡量一个模型

1. 方差与偏差的概念

偏差(Bais)： 预测值和真实值之间的误差
方差(Variance)： 预测值之间的离散程度

低偏差低方差、高偏差低方差：

图中每个点表示同一个模型每次采样出不同样本训练出来的结果，我们期望的是低偏差低方差
在这里插入图片描述

低偏差高方差、高偏差高方差：
在这里插入图片描述

2. 模型泛化误差

假设我们有样本数据 $D=\{(x_1,y_1),...,(x_n,y_n)\}$ ，其中真实值 $\epsilon$
在使用模型算法评价时，通常使用预测值 $\hat y$ 和真实值 $y$ 的距离，最常用的函数就是距离的平方，均方误差如下公式：
在这里插入图片描述

在这里插入图片描述

如下图所示（横轴表示模型复杂度，纵轴表示误差）我们希望在中间位置找到一个合适的模型复杂度，使得泛化误差尽可能的小。模型过于简单会导致欠拟合，模型过于复杂会导致过拟合。

$泛化误差 = 偏差^2 + 方差 + 数据噪声$

如果模型选择过于简单，会有很多特征学习不到，此时预测值与真实的误差就会很大，即偏差很大
随着模型的复杂度提升，模型学到特征也会越多，此时偏差会逐渐降低
当模型变得更复杂，模型此时可能会学习到一些数据噪声，此时方差变大

在这里插入图片描述

3. 降低方差、偏差、数据噪音

减少偏差：

使用较为复杂模型
集成学习算法 Boosting、Stacking

减少方差：

使用一个较为简单的模型
使用L1、L2等正则化技术
集成学习算法 Bagging、Stacking

减少数据噪音：

来自于数据采集误差，需要更精确的数据采集

本文参考：

https://blog.csdn.net/weixin_42327752/article/details/121428875

原文地址：https://blog.csdn.net/qq_42761751/article/details/145033431

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：144.《在 macOS 上安装 Redis》
下一篇：Java的Stream流和Option类

lanqiaoOJ 3333：肖恩的排序 ← 双指针+排序（从大到小）
本题之所以使用从大到小排序，主要是可以大大降低计算量。
阅读更多2025-01-16
Inxpect毫米波安全雷达:精准检测与动态保护,工业自动化可靠选择
Inxpect毫米波安全雷达以其高灵敏度和分辨率，能精准检测微小移动，如呼吸。在工业生产中，雷达能动态调整监控范围，适应生产线变化，有效保护操作人员安全，满足灵活监控需求。作为工业自动化和机器人系统中
阅读更多2025-01-16
Github 2025-01-15 C开源项目日报 Top10
根据Github Trendings的统计，今日(2025-01-15统计)共有10个项目上榜。
阅读更多2025-01-16
[Java Web] 第四章 XML_Tomcat10_HTTP
1.创建SAXReader对象2. 解析XML获取Document对象: 需要传入要解析的XML文件的字节输入流3. 获取文档的根标签4. 获取标签的子标签//获取所有子标签//获取指定标签名的子标签
阅读更多2025-01-16
Transformers Learning Rate Schedules
起始阶段可以使用较大的学习率，在后续阶段根据多项式的衰减规律减小学习率，直到达到最小值。常数学习率调度器，带热身：在训练开始时通过一个热身阶段逐渐增加学习率，然后在后续训练中保持学习率不变。线性衰减调
阅读更多2025-01-16
MongoDB 学习指南与资料分享
在数据爆炸的当下，MongoDB 作为非关系型数据库的佼佼者，以其独特优势在各领域发光发热。无论是海量数据的存储，还是复杂数据结构的处理，MongoDB 都能轻松应对。接下来，让我们一同深入探索 Mo
阅读更多2025-01-16
（python）数据分析-描述性统计
在不进行复杂的统计分析的情况下，快速提供数据的基本特征。这对于在数据分析的早期阶段了解数据的性质非常有用。
阅读更多2025-01-16
Vue 页面布局组件-Vuetify、Semantic
在你的组件目录下创建一个名为。
阅读更多2025-01-16
C51交通控制系统的设计与实现
利用51单片机实现对红绿灯的控制
阅读更多2025-01-16
docker 安装mongodb
加27017测试是否能访问（服务器要开放27017端口），当然如果是本地虚拟机搭建用虚拟机的IP+27017端口测试就行。首先要保证服务器开启27017端口，然后用。
阅读更多2025-01-16

【深度学习】通俗理解偏差(Bias)与方差(Variance)

1. 方差与偏差的概念

2. 模型泛化误差

3. 降低方差、偏差、数据噪音

相关文章