【机器学习】机器学习实验方法与原则（详解）

🕗 发布于 2024-03-19 08:48 机器学习 人工智能

• 训练集、验证集与测试集

训练集与测试集

• 训练集（作业）：模型可见样本标签，用于训练模型，样本数有限

• 在训练集上表现好的模型，在其他未见样本上一定表现好吗？小心 过拟合 ！

• 未见样本（所有没做过的题）往往有指数级别或无穷多个

未见

• 测试集（考试）：用于评估模型在可能出现的未见样本上的表现

• 尽可能与训练集互斥，即测试样本尽量不在训练集中出现，为什么？

这是因为测试集的目的是评估模型的泛化能力，即模型在未见过的数据上的表现。如果测试集中包含了训练集中的样本，那么模型在测试集上的表现可能会被过度乐观地评估，因为模型已经在训练过程中见过这些样本，从而可能记住了这些数据的特征，而不是真正地学习到了泛化规律。

• 估计模型在整个未见样本上的表现

训练集与测试集的划分方式

• 随机划分

• 按比例，例如 9:1 、 8:2

• 固定数目，例如测试集从全部样本中采样 1w 个，其余为训练集

• 留一化分（ leave-one-out ）

• 一个样本作测试，其余样本训练：常用于 K 近邻等算法的性能评估

• 特殊划分

• 按时间划分，例如 1-5 月气象数据作训练， 6 月气象数据作测试

• 推荐系统中，常把每个用户交互序列的最后一个样本作测试，其余作训练

验证集

• 从训练集中额外分出的集合，一般用于超参数的调整

• 训练轮次、正则化权重、学习率等等

• 为什么不在训练集上调整超参数？过拟合训练集

• 为什么不在测试集上调整超参数？过拟合测试集

• 针对当前测试集调出的参数可能只在当前测试集上较好

• 使得测试集结果偏高，不能反映实际在所有未见样本上的效果

• 类比：针对某场考试的知识点分布作重点复习，不能准确反映学生对所有知识的掌握程度。

• 举例：机器学习竞赛中，针对公开部分的测试数据过度调参，不一定在隐藏的全部测试数据上表现好。

• 随机重复实验

• 测一次就足够了吗？

• 极端情况：二分类中分类器随机输出，恰好测试集都对了（效果最好？）

• 数据随机性

• 由数据集划分带来的评价指标波动

• 模型随机性

• 由模型或学习算法本身带来的评价指标波动

• 例如：神经网络初始化、训练批次生成

• 数据随机性

• （数据足够多时）增多测试样本

• （数据量有限时）重复多次划分数据集

• 模型随机性

• 更改随机种子重复训练、测试

• 注意：保持每次得到的评价指标独立同分布 (iid)

• 报告结果：评价指标的均值

• 样本标准差(个体离散程度，反映了个体对样本均值的代表性)

• 标准误差(样本均值的离散程度，反映了样本均值对总体均值的代表性)

• K折交叉验证

• 随机把数据集分成 K 个相等大小的不相交子集

• 优点：数据利用率高，适用于数据较少时

• 缺点：训练集互相有交集，每一轮之间并不满足独立同分布

• 增大 K ，一般情况下：

• 所估计的模型效果偏差（ bias ）下降

• 所估计的模型效果方差（ variance ）上升

• 计算代价上升，更多轮次、训练集更大

• K 一般取 5 、 10

原文地址：https://blog.csdn.net/chen695969/article/details/136796982

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：拌合楼管理系统开发（六）海康威视摄像头调用拍照
下一篇：NCV7321D11R2G收发器中文资料PDF数据手册引脚图参数图片价格芯片概述特性原理

Linux系统下svn新建目录
Linux安装svn自行查找。
阅读更多2024-11-14
Scala的不可变Map常用操作
/3.1 get方法：输入key，如果找到，就返回包装数据，如果没有找到，就返回None。val map1 = Map("鄂"->"湖北省","
阅读更多2024-11-14
mqtt学习笔记（一）
mqtt相关笔记（一）之mqtt初探，以提出、解决问题的方式来逐步学习
阅读更多2024-11-14
Ken和Bwk趣说UNIX
[肯汤普森和布莱恩(AWK作者之一)趣说UNIX](https://www.bilibili.com/video/BV1nP411t7gt/ “肯汤普森和布莱恩(AWK作者之一 “肯汤普森和布莱恩(A
阅读更多2024-11-14
【CentOS】中的Firewalld：全面介绍与实战应用（上）
本文深入探讨了CentOS操作系统中Firewalld防火墙的全面功能与实战应用。首先，文章概述了Firewalld的基本概念，强调了它在现代Linux系统中作为动态管理防火墙规则的重要工具的地位。与
阅读更多2024-11-14
新手小白学习docker第七弹------安装redis集群大厂面试
新手小白学习docker第七弹----安装redis集群大厂面试
阅读更多2024-11-14
/// ts中的三斜线指令 | 前端
包），你需要在你的项目中以某种方式告诉TypeScript编译器这些类型定义的存在。三斜线指令是一种在单个文件中这样做的方式，虽然在实际项目中，更常见的是通过。1. 这行代码是TypeScript中
阅读更多2024-11-14
快速掌握——python类封装[私有属性方法]、继承【python进阶】(内附代码)
python类的封装【私有属性、私有方法、属性装饰器】类的继承
阅读更多2024-11-14
2024年5款大屏可视化工具多维分析对比
经过对市场上多款大屏可视化工具的深入研究和对比，强烈推荐FineVis作为您的首选。无论您是希望快速搭建大屏项目、展示复杂3D模型还是实现多屏适应和实时数据分析，FineVis都能满足您的需求。文章中
阅读更多2024-11-14
计算机网络-mac地址与ip地址的区别总结
mac地址在OSI模型中的第二层数据链路层工作，数据链路层基于mac地址进行转发数据帧【交换机基于mac地址表转发数据】ip地址在OSI模型中的第三层网络层工作，网络层基于ip地址转发报文【路由器
阅读更多2024-11-14