【自学笔记】神经网络（2） -- 模型评估和优化

🕗 发布于 2024-11-13 22:38 笔记神经网络 机器学习

文章目录

划分数据集
偏差与方差
学习曲线
- error - train set size
- error - degree of polynomial
数据增强
迁移学习
项目的完整周期
样本不平衡问题
- 精确率和召回率
- 精确率与召回率的平衡

划分数据集

我们当然希望把所有数据都用来优化模型，然而数据是有限的，我们要追求最大化数据的效用，用最少的数据训练出最好的效果。

训练集和测试集

通常，我们会将数据集划分一部分出来，用来测试模型在未出现过的数据中的能力（泛化能力）。

训练误差

训练误差（Training Error）指模型在训练数据集上的预测误差。它衡量的是模型对已知数据的拟合程度。可以用来判断是否欠拟合

测试误差

测试误差（Test Error）是指模型在未见过的测试数据集上的预测误差。它衡量的是模型的泛化能力，即模型在新数据上的表现。可以用来判断是否过拟合

交叉验证测试集

交叉验证（Cross-Validation）是一种评估机器学习模型性能和选择模型参数的方法，通过将数据集分为多个子集来进行。交叉验证的主要目标是减少过拟合的风险，并提供模型在未知数据上的性能评估。其中常用的是一种称为K折交叉验证（K-fold Cross-Validation）的方法。
在K折交叉验证中，数据集被随机划分为K个子集（或称为“折”）。然后，模型被训练K次，每次使用K-1个子集作为训练数据，剩下的一个子集作为验证数据（或测试集）。这样，每个子集都会在验证过程中被用作一次测试集，而其余部分的子集会被用作训练集。模型的性能通常通过这K次训练和验证过程中的平均表现来评估。
优点：数据资源有效利用
缺点：算力资源要求较高
此外，对于某些数据（如时间序列数据），标准的K折交叉验证可能并不适用，因为它假设数据是独立同分布的，而时间序列数据通常具有顺序依赖性。

偏差与方差

偏差

偏差（Bias）是指模型预测值的期望与真实值之间的差异，高偏差模型在拟合训练数据时存在“欠拟合”

方差

方差（Variance）是模型预测值的差异程度，即预测值在不同数据集上的变动性。它可以用预测值的方差来表示。方差过大表示模型存在“过拟合”

表现基准

注意，模型具有较高的偏差或方差不一定意味着模型不好，通常会将人类做相同任务所产生的偏差与方差作为表现基准。此外，也可以在其他竞争算法的基础上作优化。

学习曲线

error - train set size

在这里插入图片描述
这里是选定模型后，增加数据集大小的情况。随着数据集大小增大，交叉验证误差减小，泛化能力增强；同时训练误差增大，这是因为固定的模型（如 $f_{w,b}(x)=w_{1}x + w_{2}x^{2}+b$ ）会越来越难以完美拟合所有样本点。

数据集足够大时，曲线会趋于平坦。这可能是由于当前的模型过于简单，无法继续拟合出更好的效果了，这时候就可以考虑更换或优化模型，而不仅仅是向它输入更多的数据。

在这里插入图片描述
而如果出现交叉验证误差远高于训练误差的情况，可能就是数据量不足或模型设计过于复杂。有时，正则化可以很好解决问题。

error - degree of polynomial

在这里插入图片描述
这是误差与模型复杂度的图线，这里采用多项式函数，所以复杂度就是多项式的维度。

数据增强

在数据不足或数据特征过于单一时，可以用一些手段从已有的数据中生成额外的数据，从而实现数据增强。比如，现在你有一张写有字母A的图片，你可以对它进行旋转、模糊、放缩等一系列操作，并保持标签 $A$ 不变，那么，你就成功将数据集扩充了若干倍，模型的泛化能力也能得到提升。类似的，我们还可以在音频中混入不相干的噪音，或在文本中加入少量不相干的字符，来人为地为数据集添加噪声。

迁移学习

迁移学习是指在机器学习领域中，利用一个神经网络在源任务上学习到的知识，帮助解决另一个相关但不同的目标任务。这一过程可以显著减少目标任务所需的训练时间、数据量和计算资源。
（1）微调（Fine-tuning）：将预训练的神经网络模型应用到新的任务上，并对模型的部分或全部参数进行微调。通常，预训练模型是在大规模数据集（如ImageNet）上训练的，这些模型已经学习到了丰富的特征表示。在新的任务上，通过微调模型的最后几层或所有层，可以快速适应新的数据集。
比如，如果你想实现一个0~9数字识别的模型，而已经有了识别小猫小狗等各种类别的模型，可以只修改这个模型的输出层，来快速实现任务。
（2）特征提取：预训练模型的前几层通常学习到的是低级特征（如边缘、纹理等），这些特征在许多任务中都是通用的。因此，可以将这些层作为特征提取器，直接用于新的任务。
（3）冻结层：在新的任务中，可以冻结预训练模型的前几层，只训练新的分类层或其他特定任务的层，这样可以减少计算资源的消耗，同时利用预训练模型的泛化能力。
（4）…

项目的完整周期

在这里插入图片描述

样本不平衡问题

当样本中某一标签数量远大于其余种类时，模型会表现出倾向该标签的特征，从而达到虚假的高准确率。
在这里插入图片描述
预测正确标记为 $T r u e$ ，预测错误标记为 $F a l se$ ，标签为1标记为 $p os i t i v e$ ，标签为0标记为 $n e g a t i v e$ 。

精确率和召回率

则引入两个比值来评估这个模型：
（1）精确率： $\frac{True \ positives} {Predicted \ positives}$
（2）召回率： $\frac{True \ positives} {Actrual \ positives}$
高的精确率意味着模型误判率低，高的召回率意味着模型漏判率低

精确率与召回率的平衡

精确率和召回率之间通常存在权衡关系。提高精确率往往会降低召回率，反之亦然。
我们引入 $\text{F1 Score} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$ 在精确率和召回率之间寻求平衡，特别是在两者都重要的情况下。
更一般的则有 $\text{Fβ Score} = (1 + \beta^2) \times \frac{\text{Precision} \times \text{Recall}}{(\beta^2 \times \text{Precision}) + \text{Recall}}$
（1）当 $β = 1$ 时， $\text{Fβ Score}$ 等同于 $\text{F1 Score}$ ，可以根据需求灵活调整参数 $β$ 。
（2）当 $β < 1$ 时，精确率的权重更高。
（3）当 $β > 1$ 时，召回率的权重更高。

原文地址：https://blog.csdn.net/qq_40432278/article/details/143684350

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：vue配置动态代理
下一篇：啥是CTF？新手如何入门CTF？

算数基本定理@质因数分解原理
把自然数写成素数的乘积，结论就是著名的算术基本定理。此定理建立了自然数与素数之间的一个重要的关系式。算数基本定理是整除理论性质和结论的精华,是整个初等数论的基础证明一些方程是否有整数解能够从公式的角度
阅读更多2024-11-15
用 Python 从零开始创建神经网络（六）：优化（Optimization）介绍
在随机初始化的模型中，或者即使是采用更复杂方法初始化的模型中，我们的目标是随着时间的推移培训或教育一个模型。为了训练一个模型，我们调整权重和偏差以提高模型的准确性和置信度。为此，我们需要计算模型的错误
阅读更多2024-11-15
海思3403对RTSP进行目标检测
用ss928 实现rtsp流的目标检测
阅读更多2024-11-15
亮数据——助力全球数据抓取的高效代理平台
特别是在需要跨境数据采集的场景中，亮数据的全球代理池能够让用户根据目标网站的地域需求，选择不同地区的IP地址，以此提升数据抓取的稳定性和成功率。亮数据不仅提供了丰富的IP资源，还内置了智能管理系统，可
阅读更多2024-11-15
【卡尔曼滤波】递归算法Recursive的应用 C语言、Python实现（Kalman Filter）
【卡尔曼滤波】递归算法Recursive的应用 C语言、Python实现（Kalman Filter）
阅读更多2024-11-15
记一次工作中订单幂等处理方案
当然可以考虑在数据库新增一张表，这张表上有第三方订单号的字段，并为此字段建立唯一索引，每次下单前预先往这张表插入数据，如果此第三方订单号已存在，那么插入数据必然报错。第一次是通过分布式锁检测，这是在
阅读更多2024-11-15
大数据湖项目建设方案（100页WORD）
随着信息技术的飞速发展，数据量呈现出爆炸性增长的趋势。企业、政府机构及科研单位在运营过程中积累了大量的数据资源，这些数据中蕴含着巨大的价值，但如何高效地存储、处理和分析这些数据，成为了一个亟待解决的问
阅读更多2024-11-15
深度学习笔记14-卷积神经网络2
卷积神经网络，是包含卷积运算且具有深度结构的前馈神经网络。在卷积神经网络中，包含卷积层、池化层和全连接层三种重要的结构。相比前馈神经网络，卷积层和池化层是新增的网络结构，在提取特征时，卷积神经网络使用
阅读更多2024-11-15
[Mysql基础] 表的操作
1.1 语法说明：field表示列名datatype表示列的类型字符集，如果没有指定字符集，则以所在数据库的字符集为准collate校验规则，如果没有指定校验规则，则以所在数据库的校验规则为准。
阅读更多2024-11-15
Mysql-DDL语句
Mysql DDL语句的使用方法和配置命令，可以更加快速熟悉的掌握Mysql基本操作命令
阅读更多2024-11-15