光流法与直接法在SLAM中的应用

🕗 发布于 2024-11-12 12:15 数码相机自动驾驶 人工智能 自动化

本文总结视觉SLAM中常用的光流法与直接法

1、Lucas-Kanade光流法

相机所拍摄到的图像随相机视角的变化而变化，这种变化也可以理解为图像中像素的反向移动。“光流”（Optical Flow）是指通过分析连续图像帧来估计场景中像素或特征点的运动的技术，即根据连续的两张图片和已知某个固定的空间点在 $t$ 时刻对应的的像素坐标 $\mathbf{q}$ ，估计其他时刻该空间点对应的像素坐标 $\mathbf{p}$ 光流法常用算法为LK光流法

在这里插入图片描述

LK光流法常用算法为常用的光流法，在LK光流法中，认为图像中每个像素坐标 $u,v]^{T}$ 处的灰度都是随时间 $t$ 变化的函数，且做如下两条假设：

灰度不变假设：同一空间点对应的像素坐标的灰度值，在各个图像中是不变的
局部运动一致假设：相邻区域内的像素具有相同的运动

1.1、解析解法

设对应于同一空间点的像素随时间变化的函数为 $(u (t), v (t))$ ，根据灰度不变假设，存在固定灰度值 $C$ ，有
$I(u(t),v(t),t)=C\tag{1}$
在上式中，对 $t$ 求导得到
$\frac{\partial{I}}{\partial{u}}\frac{\partial{u}}{\partial{t}}+\frac{\partial{I}}{\partial{v}}\frac{\partial{v}}{\partial{t}}+\frac{\partial{I}}{\partial{t}}=0\tag{2}$
$\nabla_{t}u=\frac{\partial{u}}{\partial{t}},\nabla_{t}v=\frac{\partial{v}}{\partial{t}}$ 为 $x$ 轴， $y$ 轴方向上的像素移动速度，这两个量也是LK光流法的求解目标， $\nabla_{u}I=\frac{\partial{I}}{\partial{u}},\nabla_{v}I=\frac{\partial{I}}{\partial{v}}$ 为灰度在 $x, y$ 方向上的梯度，也可称为像素梯度， $\nabla_{t}I=\frac{\partial{I}}{\partial{t}}$ 为固定点处灰度对时间的导数

$(2)$ 可以化简为
$[\nabla_{u}I,\nabla_{v}I]\begin{bmatrix}\nabla_{t}u\\\nabla_{t}v\end{bmatrix}=-\nabla_{t}I\tag{3}$
令 $\mathbf{w}=\begin{bmatrix}\nabla_{t}u\\\nabla_{t}v\end{bmatrix}$ ，上式是一个二元一次方程，仅靠该方程无法计算 $\mathbf{w}$ ，还需引入其他约束。

根据局部运动一致假设，可以认为像素 $\mathbf{q}_{i}$ 附近的某邻域内全部像素 $\mathbf{q}_{j},j=1,\cdots,w$ 再 $\Delta{t}$ 时间段内具有相同的运动，因此 $(3)$ 可以写成
$\begin{bmatrix}\nabla_{u} I_{1}(\mathbf{q}_{1}),\nabla_{v} I_{1}(\mathbf{q}_{1})\\\vdots\\ \nabla_{u} I_{1}(\mathbf{q}_{w}),\nabla_{v} I_{1}(\mathbf{q}_{w})\end{bmatrix}\mathbf{w}=\begin{bmatrix}-\nabla_{t}I(\mathbf{q}_{1})\\\vdots\\-\nabla_{t}I(\mathbf{q}_{w})\end{bmatrix}\tag{4}$
其中
$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ \nabla_{u} I_{…$
记 $(4)$ 中系数矩阵为 $\mathbf{A}$ ，等号右侧矩阵为 $\mathbf{b}$ ，则方程变为
$\mathbf{A}\mathbf{w}=\mathbf{b}$
上式是关于 $\mathbf{w}$ 的超定方程组，可以通过最小二乘的方式求解，即令
$\mathbf{w}^{\ast}=\underset{\mathbf{w}}{\arg\min}\,\|\mathbf{A}\mathbf{w}-\mathbf{b}\|^{2}\tag{6}$
根据§1，容易求出 $\mathbf{w}^{\ast}$ ，根据 $\mathbf{q}_{i}+\mathbf{w}^{\ast}\Delta{t}$ 即可计算新像素位置

1.2、优化解法

通过最小化两张图像对应像素邻域内的灰度差也可以求出给定点 $\mathbf{q}$ 在第二张图像中的对应像素 $\mathbf{p}$ ，即
$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ \mathbf{p}^{\a…$
$\mathbf{e}_{j}$ 对 $\mathbf{p}$ 的雅可比矩阵为
$\mathbf{J}_{j}=\frac{\partial\mathbf{e}_{j}}{\partial\mathbf{p}}=\begin{bmatrix}-\nabla_{u}I_{2}(\mathbf{p}_{j})\\ -\nabla_{v}I_{2}(\mathbf{p}_{j})\end{bmatrix}\tag{8}$
再求出
$\mathbf{H}_{k}=\sum_{j=1}^{w}\mathbf{J}_{j}\mathbf{J}_{j}^{T}\quad\quad \mathbf{b}_{k}=\sum_{j=1}^{w}\mathbf{J}^{T}_{j}\mathbf{e}_{j}$
增量方程为如下式，可以通过增量方程计算更新量
$\mathbf{H}_{k}\Delta\mathbf{p}_{k}=-\mathbf{b}_{k}$
得到更新量后，第二张图片中像素坐标可以更新为
$\mathbf{p}_{k+1}=\mathbf{p}_{k}+\Delta\mathbf{p}_{k}$

2、直接法

在这里插入图片描述

直接法并不单独估计第二张图片中的像素点位置，而是对第一张图片中的像素点，根据相机位姿估计值寻找其在第二张图片中对应的像素位置，并通过图片中对应像素的灰度差不断优化相机位姿变换，得到最优位姿变换，同时使两张图片的灰度差最小。下面进行详细说明。

已知像素 $\mathbf{q}_{i},i=1,\cdots,n$ 和其对应的深度，及摄像机内参矩阵
$\mathbf{K}=\left[\begin{array}{ccc} f_{x}&0&c_{x}\\ 0&f_{y}&c_{y}\\ 0&0&1 \end{array}\right]$
可以还原出三维空间位置 $\mathbf{x}_{i}$ ，令 $\mathbf{X}_{i}=\begin{bmatrix}\mathbf{x}_{i}\\1\end{bmatrix}\in\mathbb{R}^{4}$ ，并记从第一张图片到第二张图片对应的相机位姿变换为 $\mathbf{T}\in SE(3)$ ，则 $\mathbf{x}_{i}$ 在第二个相机坐标系下的空间坐标为
$\mathbf{y}_{i}=(\mathbf{T}\mathbf{X}_{i})_{1:3}=[X,Y,Z]^{T}$
对应的像素坐标为
$\mathbf{p}_{i}=\frac{1}{Z}(\mathbf{K}\mathbf{y}_{i})_{1:2}$
直接法求解优化问题
$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ \mathbf{T}^{\a…$
暂时省略下标，根据链式求导法则得到
$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ \frac{\partial…$
容易得到
$\frac{\partial{\mathbf{p}}}{\partial\mathbf{y}}=\begin{bmatrix} \frac{f_{x}}{Z}&0&-\frac{f_{x}X}{Z^{2}}\\ 0&\frac{f_{y}}{Z}&-\frac{f_{x}Y}{Z^{2}} \end{bmatrix}\quad\quad\frac{\partial\mathbf{y}}{\partial\mathbf{T}}=[\mathbf{I},-\mathbf{y}^{\wedge}]$
因此 $(10)$ 后两项可以写成
$\frac{\partial\mathbf{p}}{\partial\mathbf{T}}=\frac{\partial\mathbf{p}}{\partial\mathbf{y}}\frac{\partial\mathbf{y}}{\partial\mathbf{T}}=\begin{bmatrix} \frac{f_{x}}{Z}&0&-\frac{f_{x}X}{Z^{2}}&-\frac{f_{x}XY}{Z^{2}}&f_{x}+\frac{f_{x}X^{2}}{Z^{2}}&-\frac{f_{x}Y}{Z}\\ 0&-\frac{f_{y}}{Z}&-\frac{f_{x}Y}{Z^{2}}&-f_{y}-\frac{f_{y}Y^{2}}{Z^{2}}&\frac{f_{x}XY}{Z^{2}}&\frac{f_{x}X}{Z} \end{bmatrix}\tag{11}$
故 $(10)$ 又可以写成
$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ \frac{\partial…$
问题 $(9)$ 的雅可比矩阵为
$\mathbf{J}_{i}=\frac{\partial\mathbf{e}_{i}}{\partial\mathbf{T}}$
由此得到
$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲\mathbf{H}_{k}=…$
则更新量可以通过下式计算
$\mathbf{H}_{k}\Delta\mathbf{T}_{k}=-\mathbf{b}_{k}$

并通过下式更新
$\mathbf{T}_{k+1}=\mathrm{Exp}(\Delta\mathbf{T}_{k})\mathbf{T}_{k}$
最终得到最优的位姿变换

实验

直接法在kitti数据集上的效果如下图，可以看到追踪效果良好
在这里插入图片描述

附录

§1、标准最小二乘问题

标准最小二乘问题对给定 $\mathbf{A}\in\mathbb{R}^{M\times{N}}$ ，计算 $\mathbf{x}^{\ast}\in\mathbb{R}^{N}$ ，使得
$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ \mathbf{x}^{\a…$
首先对 $\mathbf{A}$ 进行SVD分解
$\mathbf{A}=\mathbf{U} \begin{bmatrix} \boldsymbol\Sigma_{r\times{r}}&\mathbf{O}\\ \mathbf{O}&\mathbf{O} \end{bmatrix}\mathbf{V}^{T}$
则 $\mathbf{A}$ 的伪逆为
$\mathbf{A}^{\dagger}=\mathbf{V} \begin{bmatrix} \boldsymbol\Sigma_{r\times{r}}^{-1}&\mathbf{O}\\ \mathbf{O}&\mathbf{O} \end{bmatrix}\mathbf{U}^{T}\tag{A2}$
可以证明，满足 $\mathrm{(A1)}$ 的模长最小的解为
$\mathbf{x}^{\ast}=\mathbf{A}^{\dagger}\mathbf{b}\tag{A3}$
特别地，当 $\mathrm{rank}(\mathbf{A})=N$ 时， $\mathbf{A}^{\dagger}=(\mathbf{A}^{T}\mathbf{A})^{-1}\mathbf{A}$ ， $\mathrm{(A1)}$ 仅有如下一个解
$\mathbf{x}^{\ast}=(\mathbf{A}^{T}\mathbf{A})^{-1}\mathbf{A}\mathbf{b}\tag{A4}$

原文地址：https://blog.csdn.net/qq_54375651/article/details/143666542

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Redis五种数据类型剖析
下一篇：echarts-gl 3D柱状图配置

手机ip地址异常怎么解决
在现代社会中，手机已成为我们日常生活中不可或缺的一部分，无论是工作、学习还是娱乐，都离不开网络的支持。然而，有时我们会遇到手机IP地址异常的问题，这不仅会影响我们的网络体验，还可能带来安全隐患。本文将
阅读更多2024-11-17
Windows 小记 5 -- 判断账户是否是管理员账户
域用户（针对间接或者嵌套用户组，最佳的获取方式是通过令牌SID，如果用户账户已经登陆，则可以通过进程句柄获取令牌，否则，则需要通过凭据登陆获取令牌）此外需要注意，当账户没有启用时，可能是无法创建和登陆
阅读更多2024-11-17
Python 小高考篇（5）自定义函数
通过def关键词，可以自定义一个函数，之后再在代码内调用它。第一行代表定义一个函数，函数名字叫hello；第2行到第3行代表该函数需要执行的东西，第4行代表执行该函数。lambda是一种很简洁（偷懒）
阅读更多2024-11-17
MySQL慢日志
日志顾名思义就是查询慢的sql语句可以记录到一个日志文件里，至于有多慢才会被记录，默认是10秒，但也可以通过系统配置来更改，慢日志在做系统优化时是一个非常好用的工具。上面的操作只是对本次MySQL服务
阅读更多2024-11-17
凹凸/高度贴图、法线贴图、视差贴图、置换贴图异同
因为NormalMap只是改变的表面上的光照结果，并没有改变表面上的形状，不能实现自身内部的遮挡，因此不能表现平面上凹凸起伏比较大的场合。根据经验，这个凸起会很轻易的挡住我们的视线，让我们看不见那支牙
阅读更多2024-11-17
PMBOK® 第六版控制进度
制定了明确的计划后，对计划的控制尤为重要。例如，经常提到的“累积效应”，如果某个阶段的评分仅为0.9分，那么五个得分为0.9分的阶段，最终结果可能只是一个0.5分。
阅读更多2024-11-17
网络通信NetClient实现
上一集我们就完成了数据中心类的内容，那么我们开始需要进行网络的通信，我们这一集就要封装一个类来帮我们实现网络上的通信。
阅读更多2024-11-17
frp内网穿透介绍安装教程
内网穿透（Port Forwarding）是将公网上的IP地址映射到内部网络中的一台计算机的某个端口上，以便外部网络可以访问该计算机中运行的应用程序。内网穿透技术可以通过一些开源工具来实现，其中比较常
阅读更多2024-11-17
【网络】子网掩码
前面我们已经学习了网络的基础知识，对网络的基本框架已有认识，算是初步认识到网络了，如果上期我们的学习网络是步入基础知识，那么这次学习的板块就是基础知识的实践，我们今天的板块是学习网络重要之一，学习完这
阅读更多2024-11-17
网络物理隔离应用
其实公安的摄像头视频好几个王都有，视频量最大的在公安视频专网里面，还有一些就是社会资源的摄像头，比如一些酒店、网吧，他会有视频监控，这些视频监控，是要求你要把它导入到公安视频专网里面，视频专网跟互联网
阅读更多2024-11-17