深入解析 Harris 角点检测算法：从孔径问题到响应函数的完整推导

🕗 发布于 2024-10-12 09:41 计算机视觉 Harris算法

在图像处理中，角点是非常重要的特征。为了快速、准确地检测角点，Harris 提出了 Harris 角点检测算法，它基于局部窗口内图像梯度的变化来判断角点。本文将从最基础的孔径问题（Aperture Problem）入手，通过泰勒展开和向量乘法的形式逐步推导 Harris 角点检测的过程，并给出特征值分析和角响应函数的详细解释。

1. 孔径问题的引入

孔径问题常用“理发店门前转灯”进行类比说明。你可以想象一个横着旋转的灯，它看起来像是垂直方向移动，但实际上是水平方向转动。
请添加图片描述

感觉上：垂直移动
实际情况：水平旋转

在计算机视觉中，光流的计算就面临类似的问题：在仅有一个小窗口的情况下，无法确定物体的移动方向，尤其在物体具有某种平滑性时，感知的运动方向和实际运动方向可能不一致。这就是“孔径问题”。

2. 图像函数的平移与泰勒展开

在处理图像时，假设我们有一幅灰度图像，它的像素值可以用函数 $I (x, y)$ 来表示。这里 $x$ 和 $y$ 是图像的空间坐标， $I (x, y)$ 是在这个点上的像素强度值。Harris 算子的基本思想是当图像发生微小平移时，通过分析像素强度的变化来判断该区域是角点、边缘还是平坦区域。

图像的平移

考虑图像的某个点发生了微小的平移，即从 $(x, y)$ 平移到 $(x + u, y + v)$ 。那么，经过平移后的像素强度可以表示为 $I (x + u, y + v)$ ，如图所示
在这里插入图片描述

图像的平移

考虑图像的某个点发生了微小的平移，即从 $(x, y)$ 平移到 $(x + u, y + v)$ 。那么，经过平移后的像素强度可以表示为 $I (x + u, y + v)$ 。

为了简化问题，我们假设这个位移很小，因此可以使用 泰勒展开 对 $I (x + u, y + v)$ 进行近似：

$\approx I(x, y) + u \frac{\partial I}{\partial x} + v \frac{\partial I}{\partial y} + \text{高阶项}$

其中：

$\frac{\partial I}{\partial x}$ 表示图像在 $x$ 方向的梯度，记为 $I_x$ ；
$\frac{\partial I}{\partial y}$ 表示图像在 $y$ 方向的梯度，记为 $I_y$ 。

因此，我们可以将上式简化为：

$\approx I(x, y) + I_x u + I_y v$

这个式子告诉我们，当图像发生微小的平移时，像素值的变化可以通过图像梯度来近似表示。

3. 构造能量函数

在 Harris 角点检测中，关键思想是比较位移前后的像素强度差异，构造一个 能量函数 来度量这种差异。能量函数 $E (u, v)$ 描述了图像在窗口 $W$ 内的像素强度变化，它定义为：

$\sum_{(x, y) \in W} \omega(x, y) \left[ I(x+u, y+v) - I(x, y) \right]^2$

其中：

$\omega(x, y)$ 是一个权重函数，通常用于加权窗口内不同像素的影响。权重函数可以是均匀分布的矩形窗口，也可以是高斯加权窗口，如图片所示的两种形式。
- 矩形窗口：窗口内像素权重为 1，外部为 0；
- 高斯窗口：窗口内的像素权重按照高斯分布递减，使得靠近中心的像素有更大的影响。

代入泰勒展开的结果 $\approx I(x, y) + I_x u + I_y v$ ，能量函数可以近似表示为：

$\approx \sum_{(x, y) \in W} \omega(x, y) \left[ I_x u + I_y v \right]^2$

这一步已经将图像的位移引入到了能量函数中，它通过计算窗口内像素的变化来判断图像的局部特性。

4. 向量乘法形式的能量函数

为了便于计算和进一步分析，我们可以将上述能量函数写成矩阵形式。先将 $I_x u + I_y v$ 写成向量形式：

$I_x u + I_y v = \begin{bmatrix} I_x & I_y \end{bmatrix} \begin{bmatrix} u \\ v \end{bmatrix}$

因此，能量函数 $E (u, v)$ 可以写成：

$\sum_{(x, y) \in W} \omega(x, y) \begin{bmatrix} u & v \end{bmatrix} \begin{bmatrix} I_x^2 & I_x I_y \\ I_x I_y & I_y^2 \end{bmatrix} \begin{bmatrix} u \\ v \end{bmatrix}$

进一步，我们定义一个称为 结构张量（M） 的矩阵：

$\sum_{(x, y) \in W} \omega(x, y) \begin{bmatrix} I_x^2 & I_x I_y \\ I_x I_y & I_y^2 \end{bmatrix}$

于是，能量函数可以简化为：

$\begin{bmatrix} u & v \end{bmatrix} M \begin{bmatrix} u \\ v \end{bmatrix}$

这就是 Harris 算子中能量函数的向量乘法形式，它为后续的特征值分析奠定了基础。

5. 特征值分析

我们通过特征值分解对结构张量 $M$ 进行分析。这个张量 $M$ 表示的是图像局部区域的梯度信息，它的特征值 $\lambda_1$ 和 $\lambda_2$ 反映了不同方向上的强度变化。

$\lambda_1$ 和 $\lambda_2$ 是 $M$ 的特征值，它们描述了图像在不同方向上的梯度变化程度。根据特征值的大小关系，我们可以判断局部区域的图像结构。

特征值分解可以写为：

$R^{-1} \begin{bmatrix} \lambda_1 & 0 \\ 0 & \lambda_2 \end{bmatrix} R$

其中， $R$ 是旋转矩阵，用来将图像的局部梯度信息旋转到与特征值对应的方向上。

在这里插入图片描述

平坦区域：

如果 $\lambda_1$ 和 $\lambda_2$ 都很小，表示在该区域内无论在哪个方向上图像的强度变化都非常小。这意味着该区域是平坦的，图像强度几乎不变。这种区域通常位于图像的背景或均匀纹理处。
如图中所示，梯度图的分布在平坦区域非常集中， $\lambda_1$ 和 $\lambda_2$ 都接近零。

边缘区域：

如果 $\lambda_1$ 很大，而 $\lambda_2$ 很小，意味着该区域沿着一个方向（通常是边缘的方向）有较大的强度变化，而垂直于该方向的变化非常小。这种情况典型地表示边缘区域。
从梯度图中可以看出，在边缘区域，数据点呈现拉长的形状，意味着图像沿某一个方向（边缘方向）变化明显，而另一方向上的变化不显著。

角点区域：

如果 $\lambda_1$ 和 $\lambda_2$ 都很大，表示图像在该区域内的各个方向都有较大的强度变化。这意味着无论图像在水平或垂直方向移动，都会导致显著的变化，因此可以认为该区域是角点。
角点区域在梯度图中显示为近似圆形的分布，表示在多个方向上都有显著的梯度变化。

7. Harris 响应函数

为了快速判断角点，Harris 引入了一个角响应函数：

$\theta = \det(M) - \alpha \cdot \text{trace}(M)^2$

其中：

$\det(M) = \lambda_1 \lambda_2$ 是矩阵的行列式，表示局部窗口中图像的总变化。
$\text{trace}(M) = \lambda_1 + \lambda_2$ 是矩阵的迹，表示图像的总强度变化。
$\alpha$ 是经验常数，通常取 0.04 到 0.06。

通过计算这个响应函数 $\theta$ ，我们可以判断局部区域是否是角点：

角点（Corner）：
当 $\lambda_1$ 和 $\lambda_2$ 都较大时，说明图像的强度在 $x$ 和 $y$ 方向上都有明显的变化，即梯度变化较大。这种情况通常发生在角点或交叉点处。
边缘（Edge）：
当 $\lambda_1$ 较大而 $\lambda_2$ 较小（或相反）时，说明图像在一个方向上有明显变化，而另一个方向上变化较小。此时，局部区域更可能是边缘。
平坦区域（Flat Region）：
当 $\lambda_1$ 和 $\lambda_2$ 都较小时，说明图像在该区域内没有明显的强度变化（例如，在均匀的平坦区域）。此时，响应函数值 $\theta$ 也会很小。

8. Harris 算子的优缺点

Harris 角点检测算法能够有效地检测出图像中的角点，并且对图像的旋转具有较好的不变性。然而，它也有一些局限性：

对尺度不变性较差：Harris 算法对图像缩放不敏感，因此对于不同尺度的图像角点检测效果不佳。
容易受到噪声影响：如果图像中存在较多噪声，梯度计算可能会受到干扰，导致角点检测结果不准确。

为了克服这些局限性，常常会将 Harris 角点检测与其他特征提取算法（例如 SIFT 或 SURF）结合使用，以提升检测的鲁棒性。

原文地址：https://blog.csdn.net/qq_22841387/article/details/142831588

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：318页PPT5G智慧校园顶层设计方案
下一篇：UE5 武器IK瞄准系统

开发指南072-图片热点
/处理跳转： area.getAttribute('href');平台支持使用图像导航界面，例如展示如下一张图，用户点击对应位置触发对应动作。热点数据通过后台接口获取（注意处理权限，没有权限的热点不生
阅读更多2024-10-13
使用机器学习边缘设备的快速目标检测
这项机器学习研究探讨了一种低成本的边缘设备，该设备与具有计算机视觉功能的嵌入式系统集成，以提高目标检测和分类的推理时间和精度。研究的主要目标是减少推理时间并降低功耗，以支持一个竞技型类人机器人的嵌入式
阅读更多2024-10-13
【Windows】【DevOps】Windows Server 2022 安装ansible，基于powershell实现远程自动化运维部署入门到放弃！
文件URL：https://www.python.org/ftp/python/3.13.0/python-3.13.0-amd64.exe。直接拿linux主机测试ansible连接windows
阅读更多2024-10-13
C# 中循环的应用说明
一循环的概念说明二、循环类型三、循环控制语句四、无限循环
阅读更多2024-10-13
Linux `vmstat` 命令详解
vmstat（Virtual Memory Statistics）是 Linux 系统中的一个监控工具，用于报告系统的虚拟内存、进程、CPU 活动等信息。它能帮助用户了解系统的整体性能状况，尤其是内存
阅读更多2024-10-13
Linux下多任务编程（网络编程2）
本文介绍解决accpet和recv相互阻塞的问题，可以用多线程并发外也可以用epoll I/O多路复用的方式解决。
阅读更多2024-10-13
[单master节点k8s部署]37.微服务（一)springCloud 微服务
微服务架构的一个重要特点是，它与开发中使用的具体或无关。每个微服务都可以使用最适合其功能需求的语言或技术来实现。例如，一个微服务可以用Java编写，另一个微服务可以用Python、Go、Node.js
阅读更多2024-10-13
Zynq(3)使用外设MIO/EMIO
使用MIO/EMIO实现流水灯，着重介绍Zynq IP核的配置，解读vitis中的c语言程序，介绍MIO与EMIO的区别。
阅读更多2024-10-13
笔试算法总结
思路很简单，但是当时做题提交的时候，通过率总是18%。不知道为啥，后面我改成了Long类型，然后就通过了全部用例。（易错1：第一次提交没考虑0的情况）使用 StringBuilder 模拟栈的行为，通
阅读更多2024-10-13
快速学习一个算法，Transformer模型架构
它的主要思想是在同一时间通过多个独立的注意力头（Attention Head）来关注序列中不同部分的信息，然后将这些信息综合起来，生成更丰富的表示。自注意力机制的目的是对输入序列中的每个元素计算一个输
阅读更多2024-10-13