图像处理中常用的统计矩

🕗 发布于 2024-10-13 05:00 图像处理概率论

原点矩

原点矩基于随机变量与其原点（通常是0）之间的距离进行定义，用于描述数据的集中趋势、离散程度等特性。

对于一个随机变量 $X$ ，其 $r$ 阶原点矩定义为：

$\mu_r = E(X^r)$

其中：

$E$ 表示期望值。
$r$ 是一个正整数，表示矩的阶数。

连续型随机变量：如果 $X$ 是连续型随机变量，其概率密度函数为 $f (x)$ ，则 $r$ 阶原点矩可以表示为：

$\mu_r = \int_{-\infty}^{\infty} x^r f(x) \, dx$

离散型随机变量：如果 $X$ 是离散型随机变量，其概率分布列为 $p(x_i)$ ，则 $r$ 阶原点矩可以表示为：

$\mu_r = \sum_{i} x_i^r p(x_i)$

中心矩

与原点矩不同，中心矩是基于随机变量与其期望值（均值）之间的偏差进行定义的，主要用于描述数据的离散程度、对称性和峰态等特性。

对于一个随机变量 $X$ ，其 $r$ 阶中心矩定义为：

$m_r = E[(X - \mu)^r]$

其中：

$E$ 表示期望值。
$\mu = E(X)$ 是随机变量 $X$ 的期望值。
$r$ 是一个正整数，表示矩的阶数。

连续型随机变量：如果 $X$ 是连续型随机变量，其概率密度函数为 $f (x)$ ，则 $r$ 阶中心矩可以表示为：

$m_r = \int_{-\infty}^{\infty} (x - \mu)^r f(x) \, dx$

离散型随机变量：如果 $X$ 是离散型随机变量，其概率质量函数为 $p(x_i)$ ，则 $r$ 阶中心矩可以表示为：

$m_r = \sum_{i} (x_i - \mu)^r p(x_i)$

常用的统计矩

一阶原点矩（均值）：
- 定义： $\mu_1 = E(X)$
- 描述：一阶原点矩即为随机变量的期望值，表示数据的中心位置或平均值。
二阶中心矩（方差）：
- 定义： $m_2 = E[(X - \mu)^2]$
- 描述：二阶中心矩即为方差 $\sigma^2$ ，表示数据的离散程度或波动大小。方差的平方根称为标准差 $\sigma$ 。
三阶中心矩：
- 定义： $m_3 = E[(X - \mu)^3]$
- 描述：三阶中心矩经过标准化（除以标准差的三次方）后称为偏度 $\gamma_1$ ，用于描述分布的不对称性。正偏度表示分布有较长的右尾，负偏度表示有较长的左尾。
四阶中心矩：
- 定义： $m_4 = E[(X - \mu)^4]$
- 描述：四阶中心矩经过标准化（除以标准差的四次方）后称为峰度 $\gamma_2$ ，用于描述分布的峰态或“尖峭”程度。标准正态分布的峰度为3，因此有时会报告超额峰度（即峰度减去3），以突出与正态分布相比的差异。

偏度（Skewness）

偏度（Skewness）是描述概率分布对称性的统计量，用于衡量数据分布的不对称程度。具体来说，偏度可以告诉我们数据分布的尾部是否偏向某一侧。正偏度表示分布有较长的右尾，而负偏度表示有较长的左尾。标准正态分布的偏度为0，表示其是对称的。

定义

偏度通常通过三阶中心矩标准化后得到。对于一个随机变量 $X$ ，其偏度 $\gamma_1$ 定义为：

$\gamma_1 = \frac{m_3}{\sigma^3}$

其中：

$m_3 = E[(X - \mu)^3]$ 是三阶中心矩。
$\mu = E(X)$ 是随机变量 $X$ 的期望值。
$\sigma = \sqrt{m_2} = \sqrt{E[(X - \mu)^2]}$ 是标准差，其中 $m_2$ 是二阶中心矩（方差）。

标准差 $\sigma$ 的量纲与 $X$ 相同，因此 $\sigma^3$ 的量纲也是 $X$ 的量纲的三次方。通过除以标准差的三次方，偏度成为了一个无量纲的统计量，不受量纲的影响，使得不同数据集的偏度可以直接进行比较。

解释

正偏度（Positive Skewness）：
- 当 $\gamma_1 > 0$ 时，表示分布有较长的右尾。这表明大多数数据集中在左侧，而右侧有少量极端值。
负偏度（Negative Skewness）：
- 当 $\gamma_1 < 0$ 时，表示分布有较长的左尾。这表明大多数数据集中在右侧，而左侧有少量极端值。
对称分布：
- 当 $\gamma_1 = 0$ 时，表示分布是对称的，如标准正态分布。

峰度（Kurtosis）

峰度（Kurtosis）是描述概率分布形状的一个统计量，特别关注分布的“峰态”或“尖峭”程度。峰度衡量的是数据分布的尾部重厚程度以及峰顶的尖锐程度，与正态分布相比较而言。

定义

对于一个随机变量 $X$ ，其峰度定义为四阶中心矩除以方差的平方，再减去3：

$\text{Kurtosis}(X) = \frac{E[(X - \mu)^4]}{(\sigma^2)^2} - 3= \frac{m_4}{\sigma^4} - 3$

其中：

$\mu)^4]$ 表示 $X$ 的四阶中心矩。
$\mu = E(X)$ 是 $X$ 的期望值。
$\sigma^2 = Var(X) = E[(X - \mu)^2]$ 是 $X$ 的方差。

解释

标准正态分布：标准正态分布的峰度为0（或说其超额峰度为0）。这是因为它的四阶中心矩正好是方差平方的3倍，因此在上述公式中减去3之后结果为0。
正峰度（Leptokurtic）：如果一个分布的峰度大于0（即超额峰度大于0），则说明该分布比正态分布更“尖”，且具有更重的尾部。这表明分布中有更多的极端值。
负峰度（Platykurtic）：如果一个分布的峰度小于0（即超额峰度小于0），则说明该分布比正态分布更“平”，且具有较轻的尾部。这表明分布中的极端值较少，大多数观测值集中在均值附近。

统计矩的应用

描述数据分布：通过计算不同阶数的中心矩，可以全面地描述数据的分布特性，如离散程度、对称性和峰态。
参数估计：在参数估计中，中心矩常用于估计总体参数，特别是在矩估计法中。
数据分析：中心矩可以用于各种数据分析任务，如计算方差、偏度和峰度等。

MATLAB相关函数

在这里插入图片描述

原文地址：https://blog.csdn.net/u013600306/article/details/142876309

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Docker下安装RabbitMQ
下一篇：Python 工具库每日推荐【Arrow】

雷池社区版本SYSlog使用教程
雷池会对恶意攻击进行拦截，但是日志都在雷池机器上显示如何把日志都同步到相关设备进行统一的管理和分析呢？如需将雷池攻击日志实时同步到第三方服务器, 可使用雷池的 **Syslog 外发** 功能
阅读更多2024-10-13
小米电机与STM32——CAN通信
背景介绍：为了利用小米电机，搭建机械臂的关节，需要学习小米电机的使用方法。计划采用STM32驱动小米电机，实现指定运动，为此需要了解他们之间的通信方式，指令写入方法等。花了很多时间学习，但网络上相关资
阅读更多2024-10-13
Jenkins maven 编译一些问题
另外，要触发自动构建，需要勾选，Poll SCM (poll source code management) 以及 Build when a change is pushed to GitLab 或者
阅读更多2024-10-13
【Jenkins】2024 最新版本的 Jenkins 权限修改为 root 用户启动，解决 permission-denied 报错问题
【代码】【Jenkins】2024 最新版本的 Jenkins 权限修改为 root 用户启动，解决 permission-denied 报错问题。
阅读更多2024-10-13
Jenkins---01
一. 持续集成工具什么是敏捷开发敏捷开发以用户的需求进化为核心，采用迭代、循序渐进的方法进行软件开发。在敏捷开发中，软件项目在构建初期被切分成多个子项目，各个子项目的成果都经过测试，具备可视、可集成和
阅读更多2024-10-13
论文笔记：RelationPrompt :Zero-Shot Relation Triplet Extraction
提示学习关系三元组抽取
阅读更多2024-10-13
Javascript笔试题目（三）
在客户端（通常是浏览器），开发者定义一个全局函数，这个函数将作为回调函数来接收服务器返回的数据。
阅读更多2024-10-13
抖音小游戏画图&位置移动
抖音小游戏canvas画图
阅读更多2024-10-13
k8s、prometheus、grafana数据采集和展示的链路流程
对于k8s节点和pod的性能和资源使用情况的监控，常用prometheus和grafana的组合来实现。metrics server监控组件定期从kubelet获取这些数据，转换成k8s API可以识
阅读更多2024-10-13
基于GeoScene Pro的开源数据治理与二维制图规范化处理智能工具箱
该工具箱基于GeoScene4.0+/ArcGIS Pro平台，结合Python开源工具，提供了数据治理与二维制图规范化处理的全面解决方案，旨在解决GIS应用中数据转换、检查、治理和制图数据标准化处理
阅读更多2024-10-13