李宏毅机器学习深度学习：机器学习任务攻略

🕗 发布于 2024-12-12 21:32 机器学习 深度学习 人工智能

# 课程概要

介绍了当我们遇到模型效果（loss）不理想时，进行模型优化的分析方法和思路。

# Part 1> 原因分析

可能的原因：

- 数据集标签不够（标签之间的因果关联性不强）

- 模型简单（神经元层数不够）

- 优化问题（optimization）

- 训练过拟合（ovefiting）

- 训练集和测试集统计学数据分布不匹配（mismatch）

## 判断方法

#### 是不是训练集和测试集mismatch

训练集如果loss很低，但测试集loss高，则可以分析训练集和测试集的区别

mismatch的情况示例：

e.g.1 用动物园的图像分类模型，识别野生动物

e.g.2 用亚洲人的特征识别模型，识别欧洲人的特征

#### 是不是过拟合

训练集如果loss很低，但测试集loss高，且不太可能是mismatch的情况，说明很可能是过拟合

#### 模型简单

加了神经元，没有优化效果：加了神经元，训练集和测试集的loss依然很高

则排除是模型简单的原因；

#### 是不是optimization问题

不是上述两个，则可能是optimization

# Part 2> 解决思路

## 应对overfiting：

#### 方法一：增加/丰富数据集

- 收集真实数据

- 通过小样本扩增法（e.g. 图像左右反转、镜像等合理调整）

#### 方法二：增加限制条件

- 简化模型——减少参数

- 减少关联性较少的标签（features)

- 减少训练次数

- 【预告】regularization数据归一化处理

- 简化模型——减少少神经元（dropout）

- 【预告】全连接网络、CNN部分讲

# Part 3> 验证效果

通过公开数据集、私有数据集和自己的数据集中划分出的validtion set验证。

### public数据集验证：

目的：公众说服力

示例：MINST手写数字

### private数据集验证：

目的：公众说服力 / 领域内说服力。

示例：医患数据集（医患数据涉及病人隐私，常为非公开数据集）

### validation数据集验证：

目的：证明神经网络/模型结构设计合理性、可解释性（逻辑自洽）；也可以证明泛用性（可迁移性）通用性

方法：validation 数据集划分（N-flod Cross法划分， “交叉验证”取平均值）

图为N-flod中N为3的示例。

原文地址：https://blog.csdn.net/WBingJ/article/details/144328234

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【CTF-Web】文件上传漏洞学习笔记（ctfshow题目）
下一篇：《无线网络安全技术》阅读笔记

STP（生成树协议）
stp、生成树协议、stp的端口选举、stp的状态机、stp的拓扑变化、stp运算过程
阅读更多2024-12-13
Using NCCL
Using NCCL
阅读更多2024-12-13
git 只提交指定文件
2、 git add src/文件名添加需要提交的文件名（路径参考git status 打印出来的）5、 git pull 拉取合并（多人操作的话在push之前一定要pull一下，避免代码冲突）7、
阅读更多2024-12-13
vue项目启动完成时，直接跳转浏览器打开界面的方法
当启动前端项目时，一般不具备自动打开浏览器的功能。可以采用：修改package.json文件或配置vue.config.js文件简单方法实现......
阅读更多2024-12-13
python基于基于自然语言处理技术的话题文本分类
大家好我是小村学长，混迹在java圈的辛苦码农。今天要和大家聊的是一款《python基于基于自然语言处理技术的话题文本分类》毕业设计项目。项目源码以及部署相关请联系小村学长，文末附上联系信息。🎈作者：
阅读更多2024-12-13
Docker的初识
docker的认识
阅读更多2024-12-13
安卓手机怎么轻松转换更新ip网络地址
当您连接到不同的Wi-Fi网络或切换移动数据提供商时，您的IP地址通常会发生变化。请注意，这种方法并不能保证每次都能获得新的IP地址，因为有些网络可能使用相同的IP地址池。本文将为您详细解答。在更换I
阅读更多2024-12-13
微积分复习笔记 Calculus Volume 2 - 3.4 Partial Fractions
3.4 Partial Fractions - Calculus Volume 2 | OpenStax
阅读更多2024-12-13
python数据采集-URL编码处理
使用`fake_useragent.UserAgent()`来创建一个`UserAgent`对象，并通过`.random`属性获取一个随机的用户代理字符串。使用`urllib.request.Requ
阅读更多2024-12-13
C# 探险之旅：第六节 - 条件判断（if 和 else） —— 跟着“判断君”去冒险！
好了，今天的冒险就到这里啦！我们认识了超厉害的“判断君”——if和else，学会了怎么根据条件做出聪明的决定。下次探险，我们还会遇到更多新朋友，记得带上“判断君”，他会是我们的好帮手！小伙伴们，别忘了
阅读更多2024-12-13

李宏毅机器学习深度学习：机器学习任务攻略

相关文章