模型优化—输入特征归一化处理

🕗 发布于 2024-07-25 22:33 深度学习

一、normalization

归一化（规范化）是对输入数据进行处理，使其满足某种规范。

前提：线性变换，不会改变原始数据的数值顺序。

假设原值分布在第一象限的某区间，并且x轴间距较广（离散），y轴距离较窄（集中）。

在这里插入图片描述

二、零均值

第一步使数据集的平均值成为0，方法为：使每个样本减去当前的平均值。采用以下两个公式进行：

u = 1/m * sum[ X(i) ]，i = 1…m（求出当前平均值）
X= X - u

处理值将分布在以原点为中心的区间。

在这里插入图片描述

原理说明：求出矩阵所有元素的平均值，每个元素都减去平均值，从而使得矩阵整体减去了[平均值 * 元素个数]，相当于矩阵整体减去了所有元素的累加和，从而使得平均值为0。

三、一方差

第二步使数据集方差变成1，方差衡量离散程度，方差大，说明离散程度大。通过以下方法处理（注意，X为零均值后的X）：

a = 1/m * sum[ X(i) ^ 2 ]，i= 1…m

X = X / a

处理值会收窄x轴的间距，加长y轴的间距，减小离散与适当扩大原集中，使其整体离散小。

在这里插入图片描述

原理说明：

Var(X) = 1/m * sum [ ( X(i) - X‘)^2 ]，i=1…m，X’为X元素的平均值

Var(X) = 1/m * sum [ X(i)^2 ]，i=1…m，因X’为0（零均值化后）

故a为X的方差值。

Var(X/a) = 1/m * sum [ ( X(i)/a ) ^2 ]，同理X/a均值也为0。

Var(X/a) = 1/m * sum [ X(i)^2 ] * 1/a^2

Var(X/a) = 1/m * sum [ X(i)^2 ] * 1/( 1/m * sum[ X(i) ^ 2 ] )^2

分子分母都有 1/m * sum [ X(i)^2 ]，则约分后为 1/( 1/m * sum [ X(i)^2 ] ) = 1/a

由于a为X的方差值，X/a的方差值为1/a，相当于同比缩放a倍，故X/a的方差值为1（X的方差值除以X的方差值）。

三、注意事项

对训练集的输入特征进行了规范化，对测试集以及实际应用也需要进行规范化。并且a/u为训练集计算出的。（测试集不要再去计算a、u，因为数据量小，计算出来的不够泛化）

四、归一化的原因

把输入特征强行映射到均值0，方差1的标准正太分布，可以使得输入值落在激活函数对输入比较敏感的区域。（激活函数在0附近梯度比较大）因为X的离散程度大了，会导致成本函数离散也大，从而找最小值比较繁琐。故归一化可以使得梯度下降更快，从而提升学习速度。

由于不知道输入特征的离散程度，故一般都对输入特征做归一化处理。

原文地址：https://blog.csdn.net/qq_35890572/article/details/140697521

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【include头文件的顺序以及双引号““和尖括号＜＞的区别】
下一篇：Qt遇到qt自身组件找不到

配置cobbler服务提供centos7安装源
由RedHat公司基于python语言开发，作用：快速批量部署Linux系统。
阅读更多2024-09-17
【MySQL学习】基础指令全解：构建你的数据库技能
本文详细介绍了SQL操作指令的各种基础和高级操作，帮助读者掌握SQL数据库技巧。
阅读更多2024-09-17
OpenGL笔记二十一之几何类设计
— 2024-09-16 下午。
阅读更多2024-09-17
UiBot教程：实现复杂流程图的高效方法
我们需要在两个流程块之间传递“字符串格式的系统时间”，所以最简单的方法就是在流程图中定义一个变量。举个例子，我们可以创建一个名为x的流程图变量，这样在流程图所包含的所有流程块中都可以直接使用这个变量。
阅读更多2024-09-17
12 数组——27. 移除元素 ★
给你一个数组nums和一个值val，你需要原地移除所有数值等于val的元素，并返回移除后数组的新长度。
阅读更多2024-09-17
工资重回“3000块”时代
3000元是一个心理价位，但实际上对于许多家庭来说，可能在县城生活，除了基本的生活开销，很难剩下更多的钱。也就是说，如果你的工作收入在这个“五千块定律”所设定的范围内，并且在三年内没有超过平均水平的涨
阅读更多2024-09-17
谷歌向安卓用户推出Gemini Live聊天机器人
即使你的手机处于锁定状态，屏幕处于关闭状态，你也可以开始与助手交谈，而且还可以通过谷歌(Google)的新款Pixel Buds Pro 2无线耳机进行访问，这样你就可以在手机放在包里的时候免提通话。
阅读更多2024-09-17
Linux进阶命令-sed&split
sed（Stream Editor）是一个流编辑器，用于在文本流中进行文本替换和转换操作。它通常用于命令行环境下，可以接受标准输入（stdin）、文件内容或管道输入，并对文本进行修改或处理。
阅读更多2024-09-17
RTMP直播播放器的几种选择
在选择RTMP直播播放器时，需要根据具体的应用场景、平台兼容性、功能需求以及用户体验等因素进行综合考虑。同时，也可以参考其他用户的评价和专业评测来选择最适合的播放器。
阅读更多2024-09-17
Linux套接字
套接字是实现网络通信的核心组件，它提供了灵活且强大的接口，使得开发者能够轻松地在网络环境中构建复杂的应用程序。无论是TCP还是UDP协议，都可以通过适当的套接字类型来满足不同的通信需求.
阅读更多2024-09-17

模型优化—输入特征归一化处理

一、normalization

二、零均值

三、一方差

三、注意事项

四、归一化的原因

相关文章