吴恩达2022机器学习专项课程(一）第二周课程实验：特征缩放和学习率（多元）（Lab_03）

🕗 发布于 2024-04-14 20:15 机器学习 学习 人工智能

备注：笔者只对个人认为的重点代码做笔记，其它详细内容请参考吴恩达老师实验里的笔记。

1.多元特征的训练集

调用load_house_data()函数，将训练集数据保存到数组中。
X，y分别存储所有训练样本的前四列，所有训练样本的第五列
详细的训练样本，一共100行，100个训练样本。

2.特征对房屋价格的影响

房子面积越大，数据点的趋势整体上升，因此面积对价格的影响最大，卧室数量和楼层对价格的影响忽上忽下，房屋年龄对价格的影响是整体下降。
在这里插入图片描述

3.学习率为9.9e-7，运行梯度下降

设置学习率9.9乘10的负7次方，执行梯度下降，学习率设置过大，成本增加，梯度下降没有收敛。
run_gradient_descent函数，初始化w数组和b，继续调用gradient_descent_houses。
重点在于gradient_descent_houses中的导数项计算函数gradient_function。
gradient_function使用矩阵操作和向量化操作。
f_wb：存储每行训练样本的预测值y帽。
e:存储每行训练样本预测值y帽和真实y的误差。
dj_dw = (1/m) * (X.T @ e) :对应m/1后的公式内容。
dj_db = (1/m) * np.sum(e) :对应m/1后的公式内容

在这里插入图片描述

dj_dw = (1/m) * (X.T @ e)解析：
- 第1行训练样本的误差乘以第1行训练样本的第1个特征，第1行训练样本的误差乘以第1行训练样本的第1个特征，第100行训练样本的误差乘以第100行训练样本的第1个特征，所有乘积结果累积，然后除以m/1，表示对w1参数求导，结果放入dj_dw数组中的索引0位置。
- 第1行训练样本的误差乘以第1行训练样本的第2个特征，第2行训练样本的误差乘以第2行训练样本的第2个特征，第100行训练样本的误差乘以第100行训练样本的第2个特征，所有乘积结果累积，然后除以m/1，表示对w2参数求导，结果放入dj_dw数组中的索引1位置。
- 依次类推，dj_dw是一个元素数量为4的一维数组，每个元素表示w1~w4的求导结果。
dj_db = (1/m) * np.sum(e)解析：对每行训练样本的误差求和即可。
可以自己编写打印结果，更直观的查看。ctrl+s保存。
重启内核并运行全部。
看到了输出结果。
由于设置的迭代次数为10，我们抽取某一次来看看格式。
- f_wb存储100个数，这100个数就是每组训练样本计算的预测值。
- e存储100个数，是f_wb的每个元素减去y的每个元素，对应放入e。
- dj_dw是计算一次梯度后，w1~w4参数对应的值。
- dj_db是计算一次梯度后，b对应的值。
回到开始，当学习率为9.9e-7，成本函数一直增加，没有达到最小值。

4.学习率为9e-7，运行梯度下降

降低学习率，设置为9乘以10的负7次方。成本函数值在减小。
迭代次数增加，成本函数在减小，但是仍未到达最小值。

4.学习率为1e-7，运行梯度下降

继续降低学习率，1乘10的负7次方。
成本函数不断降低且能达到最小值，表示这个学习率选择比较合适。

5.特征缩放，Z标准化

函数实现Z标准化，计算并返回标准化后的特征矩阵 X_norm，均值 X_mu 和标准差 X_sigma。
绘制图标，经过特征缩放后，房屋的年龄和大小的尺度变得一致，数据分散均匀。
未标准化，每列特征最大最小的差距分别为2410，4，1，95。标准化后，每列特征最大值最小值差距为5.85，6.14，2.06，3.69，每个特征之间的尺度被缩小了。
注意看x轴，上图未标准化，下图标准化，标准化后的特征，尺度比较接近。

6.特征缩放后运行梯度下降

学习率可以选择更大，梯度下降更快。
橘色为预测值，和蓝色重合度较高，意味着特征缩放后，梯度下降更快且结果更精确。

7.特征缩放后，使用模型预测

对x_house_norm的训练集用标准化缩放，然后用线性回归函数预测房价。

8.等高线图观察特征缩放

在这里插入图片描述

原文地址：https://blog.csdn.net/AIGC_xuexishe/article/details/137624481

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：PV和uv的区别
下一篇：Windows上面搭建Flutter Android运行环境

Android 开发与救砖工具介绍
fastboot 是一个在 Android 设备的 bootloader 模式下使用的诊断工具，它可以用来修改（如刷写）设备的固件。fastboot 模式通常用于安装新的系统镜像、解锁 bootloa
阅读更多2024-11-17
MySQL：表设计
从需求中获得类，类对应到数据库中的实体，实体在数据库中表现为一张一张的表，类中的属性就对应着表中的字段（也就是表中的列）
阅读更多2024-11-17
【c++笔试强训】（第十篇）
给一个01矩阵，1代表是陆地，0代表海洋，如果两个1相邻，那么这两个1属于同一个岛。经典的floodfill算法。⽤dfs或者是bfs找出⼀个联通的区域，并且标记上。遍历整个字符串，遇到数字的时候，
阅读更多2024-11-17
力扣路径总和-112
在C++中，常量表达式是指在编译期间就能计算出结果的表达式。其值在程序运行过程中不会改变，并且可以在编译时确定。常量表达式可以是一个简单的常量，如字面常量（42、3.14等），也可以是由常量和运算符组
阅读更多2024-11-17
动态规划不同维度分析leetcode198.打家劫舍问题
一般来说，遇到递归时，先思考一维再思考二维，对于复杂的问题，可直接先对二维进行思考。一维一般注意点：（1）dp数组中当前索引对应存储空间存储的是从下标0到当前索引最优值，还是必须考虑当前索引的次优值，
阅读更多2024-11-17
算法【Java】—— 动态规划之简单多状态 dp 问题
算法【Java】—— 动态规划之简单多状态 dp 问题
阅读更多2024-11-17
深度学习工具和框架详细指南：PyTorch、TensorFlow、Keras
在深度学习的世界中，PyTorch、TensorFlow和Keras是最受欢迎的工具和框架，它们为研究者和开发者提供了强大且易于使用的接口。在本文中，我们将深入探索这三个框架，涵盖如何用它们实现经典深
阅读更多2024-11-17
[产品管理-82]：《产品经理从入门到精通》产品经理的基本思维与核心思想
定义：产品经理是任务的提出者，主要负责产品的规划、设计、推进及优化等工作，需要具备较强的创造力和一定的项目管理能力。角色：产品经理在公司内部是各个角色的粘合剂，也是公司内外的接口。他们需要负责把用户的
阅读更多2024-11-17
LeetCode Hot100 15.三数之和
2024.11.16 持续进步（双指针）
阅读更多2024-11-17
快速上手：Docker 安装详细教程（适用于 Windows、macOS、Linux）
1. **常用命令**：如 `docker pull`, `docker build`, `docker run`, `docker ps`, `docker stop` 等。2. 登录 Docker
阅读更多2024-11-17

吴恩达2022机器学习专项课程(一） 第二周课程实验：特征缩放和学习率（多元）（Lab_03）

备注：笔者只对个人认为的重点代码做笔记，其它详细内容请参考吴恩达老师实验里的笔记。

1.多元特征的训练集

2.特征对房屋价格的影响

3.学习率为9.9e-7，运行梯度下降

4.学习率为9e-7，运行梯度下降

4.学习率为1e-7，运行梯度下降

5.特征缩放，Z标准化

6.特征缩放后运行梯度下降

7.特征缩放后，使用模型预测

8.等高线图观察特征缩放

相关文章

吴恩达2022机器学习专项课程(一）第二周课程实验：特征缩放和学习率（多元）（Lab_03）