吴恩达deeplearning.ai:模型选择&交叉验证测试集的训练方法

🕗 发布于 2024-03-02 14:18 人工智能 机器学习 神经网络 深度学习

以下内容有任何不理解可以翻看我之前的博客哦：吴恩达deeplearning.ai专栏
在上一节中，我们了解了如何利用测试集来评估模型性能。今天我们来进一步完善这个想法，让你使用该技术自动选择一个更好的模型。

文章目录

模型选择
交叉验证 Cross Validation
交叉验证例子之手写识别

模型选择

上一节我们了解到，当你的模型很好地拟合训练集的时候，训练集的代价函数就不能很好地表示模型准确度（因为其代价函数基本为0），这将远远低于泛化误差（在新数据上的误差）。在此时，测试集的代价函数就比训练集的代价函数能够更好地反映模型的准确程度了。那么我们该如何利用测试集来选择更好的模型嘞。
在这里插入图片描述
以上是十个不同特征数量的模型，我们如何从中选择一个合适的模型呢？我们可以依次用这十个模型对数据进行拟合并计算出 $J_{test}$ ,通过J的大小来判断谁的效果更好。
例如你在测试完这十个模型后，发现 $d = 5$ 时， $J(w^{[5]},b^{[5]})$ 的值为最小，那么你可能会认为模型5的效果是最好的。
但是事实上，我们所测得的J可能是一种乐观的估计，它可能比真实的J要小些，原因是我们忽略了另一个变参数，就是d的大小。有可能就是恰好这个测试集的数据分布离d=5的函数比较近一些，无法排除偶然性。这个我觉得其实乍一看挺难理解的。可以做一个类比，测试集上的d就类似于训练集上的w和b，它们都是通过各自的数据集所选出来的，所以不能在各自的数据集上进行验证。因此在选择模型的时候，并不能采用这种方法。

交叉验证 Cross Validation

以上问题的解决方法是，将数据分为三个不同的子集，分别是训练集，交叉验证集（也可叫做验证集、开发集 dev set），以及测试集。
在这里插入图片描述
如上图，我们将数据集的60%设置为训练集，20%设置为交叉验证集，剩下20%为测试集。
我们使用以下三个数学公式分别计算其代价函数：
训练集误差：
$J_{train}(w,b)=\frac{1}{2m_{train}}[\sum (f-y)^2]$
交叉验证集误差：
$J_{cv}(w,b)=\frac{1}{2m_{cv}}[\sum (f-y)^2]$
测试集误差：
$J_{test}(w,b)=\frac{1}{2m_{test}}[\sum (f-y)^2]$
如此，在上面那个例子中，模型选择的方法是这样的：首先在训练集训练从而找到合适的w，b；然后在交叉验证集上测试不同的d谁的价值函数最小，最后，在测试集上测试代价最小的d的模型的泛化能力。

交叉验证例子之手写识别

交叉验证集同样也可以用于别的模型，例如我们之前了解的手写识别。
在这里插入图片描述
例如你有三个神经网络模型架构，你想从中选择效果最好的模型。那么步骤仍然和以前一样，先在训练集上得出参数w，b，然后在交叉验证集上获得代价函数最小的架构，再在测试集上证明其泛化能力。这样的步骤可以确保好的效果不是因为数据所造成的偶然结果。
为了给读者你造成不必要的麻烦，博主的所有视频都没开仅粉丝可见，如果想要阅读我的其他博客，可以点个小小的关注哦。

原文地址：https://blog.csdn.net/m0_75077001/article/details/136409933

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：基于JAVA的快递投保管理系统开源项目
下一篇：场发射透射电子显微镜（FETEM）技术壁垒高我国具备研制能力

leetcode289:生命游戏
根据，简称为，是英国数学家约翰·何顿·康威在 1970 年发明的细胞自动机。给定一个包含m × n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为（live），或0即为
阅读更多2024-10-20
MongoDB数据恢复
注意：两个MongoDB的版本要一致，本文使用的是mongo:4.2.24。先把K8S上面的MongoDB 容器停止（可以把副本改成0）。1、将容器挂载MongoDB的数据目录备份到本地。经常是数据文
阅读更多2024-10-20
C#中实现事务
C#中实现事务
阅读更多2024-10-20
【LeetCode每日一题】——560.和为 K 的子数组
给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。
阅读更多2024-10-20
「漏洞复现」满客宝智慧食堂系统 selectUserByOrgId 未授权访问漏洞
请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任。工具来自网络，安全性自测，如有侵权请联系删除。本次
阅读更多2024-10-20
React面试题目（从基本到高级）
React前端面试常见题目涵盖了React的基础概念、组件、状态管理、生命周期、性能优化等多个方面。
阅读更多2024-10-20
12.个人博客系统（Java项目基于spring和vue）
1 在校学习的学生，可用于日常学习使用或是毕业设计使用 2 毕业一到两年的开发人员，用于锻炼自己的独立功能模块设计能力，增强代码编写能力。 3 亦可以部署为商化项目使用。 4 需要完整资料及源码
阅读更多2024-10-20
YoloV8改进策略：注意力改进|DeBiFormer，可变形双级路由注意力|引入DeBiLevelRoutingAttention注意力模块（全网首发）
本次改进的核心在于将DeBiLevelRoutingAttention模块嵌入到YoloV8的主干网络中，具体位置是在SPPF（Spatial Pyramid Pooling Fast）模块之后。这一
阅读更多2024-10-20
word取消自动单词首字母大写
情况说明：在word输入单词后首字母会自动变成大写取消单词首字母大写步骤：（1）点击菜单栏文件（2）点击“更多”——>“选项”（3）点击“校对”——>“自动更正选项”（4）取消“句首字母大
阅读更多2024-10-20
web前端网页用户注册页面
【代码】web前端网页用户注册页面。
阅读更多2024-10-20

吴恩达deeplearning.ai:模型选择&交叉验证测试集的训练方法

文章目录

模型选择

交叉验证 Cross Validation

交叉验证例子之手写识别

相关文章