2021李宏毅机器学习 1 机器学习基础笔记

🕗 发布于 2024-11-05 17:45 spring cloud spring boot spring 技术 css3

机器学习的任务：

- regression：输出是一个标量scalar；

- classification：给出多个classes，输出正确的类别；

- structured learning：创造有结构的东西，比如生成一个图片或者文档；

机器学习完成任务，是通过找到一个function来实现的，一个案例学习：以youtube每天的点击量预测为例

1. 先写出一个有未知参数的function作为model，想用哪个函数来实现任务；介绍model，feature，weight，bias四个概念

2. 定义一个loss function：L(b, w)，它是一个把上述未知参数作为自变量的函数，这个函数是要评价这些参数的设定究竟好不好，通过training data进行计算

选择一个loss函数，这里用了预测结果与label的绝对误差的平均值作为了loss，loss函数有很多种形式。通过training data使用目前确定的w和b来得到预测结果，计算loss。

3. 进行优化：表现最好的参数，是能让loss最小的参数，所以要针对这一问题进行优化

优化方法：gradient descent（梯度下降）

以一个参数的优化过程为例如上图；目前可以看到的GD的缺陷：可能无法找到全局最小值，而是陷入到局部极小值处；比如上图到了w1右边的极小值点，再怎么更新都无法跑到再右边的最小值去了。（但是老师说GD真正的痛点并不是这个）

超参数 hyperparameters

在机器学习中需要自己设定的参数

上述三步是机器学习的训练过程，根据已知的trainning data进行模型的训练；下面进行测试，看一下测试的效果，可能会比较不如意；

4. 根据测试的结果，根据你的domain knowledge，需要对模型进行修改。

比如对观看人数的预测，你发现明显数据是七天一周期的变化，那用前七天来进行预测显然比用前一天的预测更加好一些。

Linear Model

（上面的例子就是一个linear model）

线性模型太简单，特征和label的关系永远都是线性的，但是事实上可能有非线性的关系，那线性模型无论怎么训练都无法很好的拟合了。

这种局限叫做model bias。

最后编辑于：2024-10-27 15:05:30

喜欢的朋友记得点赞、收藏、关注哦！！！

原文地址：https://blog.csdn.net/kelai_6792/article/details/143438878

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：SpringBoot+FileBeat+ELK8.x版本收集日志
下一篇：【自然语言处理与大模型】大模型（LLM）基础知识②

身份证人像照片验真 API 对接说明
本文将介绍一种身份证人像照片验真 API 对接说明，它可用于传入身份证人像面照片，识别身份证照片上的信息，并将姓名、身份证号、身份证人像照片与权威库的证件照进行比对，是否属于同一个人，从而验证身份证
阅读更多2024-11-06
Spring Boot 内置工具类
断言是一个逻辑判断，用于检查不应该发生的情况Assert 关键字在 JDK1.4 中引入，可通过 JVM 参数-enableassertions开启SpringBoot 中提供了 Assert 断言工
阅读更多2024-11-06
2023下半年上午（1~11）
也就是父类中定义的方法它有自己的行为，子类继承父类，默认也继承这个方法，也有这个行为，如果子类想用这个方法实现一些自己的操作行为，就可以覆盖重写。例如要相加，下面2个相加add的方法，可以在方法名ad
阅读更多2024-11-06
机器人零位、工作空间、坐标系及其变换，以UR5e机器人为例
刚体坐标系通常固定在机器人部件上，相对于基坐标系进行描述。刚体坐标系在运动过程中相对于基坐标系保持不变，但在各个关节之间的相对关系会随着运动发生变化。每个连杆坐标系通常位于两个关节之间，描述当前连杆相
阅读更多2024-11-06
屋面节能通风装置（薄型/流线型）
4、可纵向或横向布置，常用代号有TCA-1508nxy、TCA-2008nxy、TCA-3008nxy、TCA-6008nxy、TCA-9008nxy、TCA-12008nxy等；4、常用窗型代号TC
阅读更多2024-11-06
【风力发电】基于Matlab的双馈风力发电机建模仿真设计
本文针对双馈风力发电机（DFIG）系统的建模与仿真，提出了一种基于MATLAB/Simulink的设计方法。双馈风力发电机在风能利用和电力输出方面具有较高的灵活性。通过MATLAB建模和仿真，验证了D
阅读更多2024-11-06
大数据新视界 -- 大数据大厂之 Impala 性能优化：解锁大数据分析的速度密码（上）（1/30）
本文围绕 Impala 性能优化展开，阐述其对大数据分析效率和企业决策的关键意义，剖析数据规模与复杂度、查询优化等挑战。介绍数据存储（分区、压缩）和查询（索引、语句重塑）优化策略，并通过电商和金融案例
阅读更多2024-11-06
HarmonyOS 移动应用开发
HarmonyOS 中文名字是鸿蒙操作系统官方解释：HarmonyOS是一款面向万物互联时代的、全新的分布式操作系统。鸿蒙操作系统在传统的单设备系统能力的基础上，提出了基于同一套系统能力、适配多
阅读更多2024-11-06
qt获取本机IP和定位
可以获取公有IP和当前用户所在市的API ，http://whois.pconline.com.cn/ipJson.jsp?json=true找来找去都找不着，那就自己写一个╰（‵□′）╯
阅读更多2024-11-06
【vue-pdf】简单封装pdf预览组件
【代码】【vue-pdf】简单封装pdf预览组件。在Vue中使用vue-pdf来展示PDF文件，首先需要安装vue-pdf
阅读更多2024-11-06

2021李宏毅机器学习 1 机器学习基础 笔记

相关文章

2021李宏毅机器学习 1 机器学习基础笔记