VINS_MONO视觉导航算法【一】基础知识介绍
文章目录
VINS-Mono
其他文章
- VINS_MONO视觉导航算法【一】基础知识介绍
- VINS_MONO视觉导航算法【二】论文讲解+GPU实现调研
- VINS_MONO视觉导航算法【三】ROS基础知识介绍
- VINS_MONO视觉导航算法【四】VINS_Mono代码解释
说明
我是SLAM小白,由于项目需要得学习一下VINS-Mono的简单原理和流程,因此总结了这个笔记便于后续查看,本文更加适合技术小白。当然初学VINS-Mono的也是没问题的。所用到的参考资料都已经标明。
这是第一篇,这一部分介绍一些SLAM中的基础概念和流程,主要是为纯新手(比如我)准备的,请先查看目录如果发现有相关的基础,请直接跳转到第3部分查看。
简介
VINS-Mono(Visual-Inertial Navigation System - Mono)是由香港科技大学(HKUST)空中机器人实验室开发的一种用于机器人或无人机等移动平台的单目视觉惯性导航系统。VINS-Mono结合了单目相机和惯性测量单元(Inertial Measurement Unit,IMU)的数据来实现精确的姿态估计和定位。
VINS-Mono是一个单目视觉惯性状态估计器,其中的鲁棒性,如果从论文来看而不涉及工程细节的话,是指其独特的初始化策略(实际上可以对相机与IMU间的外参、IMU与相机数据间时间戳进行在线校准,借助IMU和视觉的融合而可以应对更复杂苛刻的环境等也增加了其鲁棒性),而多用途则一方面因为其本身高性能(前端使用光流追踪特征点,后端使用滑动窗口,对于边缘端还可以使用只优化位姿的方法减少计算量),从而可以适配不同设备。论文中将VINS-Mono适配到了手持设备、小车和无人机上,都取得了很好的效果。另一方面状态估计本身就是很多应用的基石,自动驾驶,AR/VR都需要实时估计设备状态。
为什么做VINS-Mono:VINS-Mono 的设计动机主要是为了提供一种成本低廉且高效的六自由度(6-DOF)状态估计方法。六自由度状态估计的最小花费就是一个单目摄像头加一个低成本IMU。状态估计器的初始化过程是鲁棒性的。对IMU预积分值和相机观测进行紧耦合的非线性优化,以取得更准确的结果。
回环检测模块是紧耦合优化相结合,使重定位的计算代价很小。
利用四自由度的姿态图优化以取得全局一致的地图。保存地图和重用地图的方式很高效。通过姿态图优化,可以将当前地图和之前保存的地图进行合并。
单目相机存在的尺度不确定问题
单目相机(monocular camera)在状态估计中存在尺度不确定问题,这是由其固有的特性决定的。具体来说,单目相机只能捕捉二维图像信息,而无法直接获取深度信息。以下是详细的解释:
缺乏深度信息
单目相机拍摄的图像只能提供场景的二维投影,无法直接获取场景中物体的真实距离(深度)。这意味着,从单张图像中,我们无法判断一个物体的实际大小或它与相机之间的距离。例如,一张照片中的汽车可能是真实的汽车,也可能是玩具汽车,仅凭一张照片我们无法区分它们的大小和距离。
尺度等价性
在单目SLAM(Simultaneous Localization and Mapping)中,尺度等价性问题表现为:对于给定的图像序列,存在无限多个可能的三维结构和相机运动轨迹,这些结构和轨迹在图像平面上的投影是相同的。具体来说,如果我们将整个场景的尺度缩放一个常数倍,同时将相机的运动轨迹也缩放相同的倍数,那么在图像平面上观察到的特征点运动是完全相同的。
对极几何和三角化
单目相机通过特征点匹配和对极几何(epipolar geometry)来估计相机的运动和场景的结构。然而,对极几何只能提供相对的几何关系,而不能提供绝对的尺度信息。例如,通过基础矩阵(Fundamental Matrix)或本质矩阵(Essential Matrix)可以估计两帧图像之间的相对位姿(旋转和平移),但这些估计是尺度无关的。
平移和深度的关系
在单目SLAM中,深度信息的恢复依赖于相机的平移运动。当相机发生平移时,通过三角化(triangulation)方法可以恢复特征点的深度。然而,如果平移运动较小,特别是近似纯旋转时,三角化方法会失效,因为特征点的视差(disparity)太小,无法准确估计深度。因此,单目相机需要足够的平移运动才能可靠地估计深度。
解决尺度不确定问题的方法
尽管单目相机存在尺度不确定问题,但通过结合其他传感器(如IMU)可以有效地解决这一问题。以下是几种常见的方法:
视觉惯性里程计(VIO)
视觉惯性里程计(Visual-Inertial Odometry, VIO)结合了单目相机和惯性测量单元(IMU)的数据,通过融合视觉和惯性信息来估计相机的运动和场景的结构。IMU可以提供高频率的加速度和角速度测量,这些测量值可以用于估计相机的平移和旋转,从而提供尺度信息。IMU提供的是相对定位信息,即相对于初始状态的运动轨迹。这意味着IMU无法提供物体在全局坐标系中的绝对位置。例如,IMU可以告诉你物体相对于起点移动了多少距离,但无法告诉你物体当前的具体地理位置。
初始尺度估计
在VIO系统中,通常需要一个初始化过程来估计初始的尺度。这个过程可以通过多种方法实现,例如:
预积分IMU数据:在初始化阶段,通过预积分IMU数据,可以估计相机的平移和旋转,从而提供初始的尺度信息。
特征点深度归一化:在初始化阶段,可以将所有特征点的深度归一化,使其平均深度为1,这样可以控制场景的尺度,使计算在数值上更稳定。
持续尺度校正
在初始化之后,VIO系统可以通过持续的尺度校正来保持尺度的准确性。例如,通过最小化特征点的重投影误差(reprojection error),可以不断优化相机的位姿和特征点的深度,从而减少尺度漂移。
摄像头数据处理
直接法(Direct Method)
核心思想
直接法利用图像中每个像素的光度信息(灰度值或颜色值),通过计算当前帧与参考帧之间的光度误差,直接优化相机的位姿和深度信息。直接法通过优化光度误差(Photometric Error)来估计相机的运动和环境的结构。具体来说,直接法假设同一三维点在不同视角下的灰度值保持不变,通过最小化像素之间的光度误差来估计相机的运动。光度误差定义为当前帧和参考帧之间对应像素的亮度差异。数学上,可以表示为:
优化目标
光度误差:假设场景的光照不变,相邻图像帧中对应点的灰度值(或颜色值)应相同。直接法通过最小化这种光度误差,求解相机运动和场景的深度。
特点
初始值敏感:直接法需要一个较好的初始位姿估计(如通过IMU或粗糙匹配得到)。这是因为优化过程依赖梯度下降,初值差距过大会导致优化失败。直接法需要一个良好的初始值,否则优化过程可能会陷入局部极小值。这通常需要通过其他方法(如特征点法)提供一个初始估计。
稠密地图优势:直接法处理图像的所有像素,因此可以生成高分辨率、稠密的地图,适用于需要精细重建的场景(如AR/VR应用)。
不依赖特征点:直接法无需检测特征点,适用于纹理不丰富的场景(如平滑墙面),因为它充分利用了图像中每个像素的亮度信息。直接法对纹理较少的场景也能工作,因为不依赖于特征点的提取和匹配。这对于一些纹理较少的环境(如白墙或走廊)非常有用。
对光照变化敏感:假设光照恒定,这一假设在实际场景中可能不成立,比如光线变化或反射会导致误差增大。
应用场景
精细重建、场景稠密重建(如SLAM系统中的稠密模块)。
间接法(Indirect Method)
核心思想
间接法通过检测和匹配图像中的特征点(如角点、边缘等),计算特征点在相邻帧之间的重投影误差,然后优化相机位姿和场景的三维结构。间接法通过提取和匹配图像中的特征点(如角点、边缘等)来估计相机的运动和环境的结构。具体来说,间接法首先提取图像中的特征点,然后通过匹配这些特征点来建立对应关系,最后通过最小化重投影误差(Reprojection Error)来优化相机的运动参数。重投影误差定义为特征点在图像平面中的投影位置与其实际位置之间的差异。数学上,可以表示为:
优化目标
几何误差(重投影误差):将场景中的三维点投影到图像平面,与实际观测到的特征点位置比较,最小化两者的误差。
特点
技术成熟:间接法使用特征点(如SIFT、ORB等)进行匹配,算法成熟且在工程实践中被广泛应用。
鲁棒性高:特征点提取和匹配对光照变化、运动模糊有一定的鲁棒性,适合多样化的场景。但间接法依赖于特征点的提取和匹配,对于纹理较少或特征重复的场景容易失败。
计算复杂度高:间接法需要额外的步骤来提取特征点和进行特征匹配,相比直接法计算复杂度更高。但间接法只需要处理少量的特征点,计算复杂度较低,适用于实时应用。
稠密地图构建不占优势:间接法只处理稀疏的特征点,生成的地图通常是稀疏的,难以满足高分辨率重建的需求。
应用场景
实时定位(如VINS-Mono使用间接法)、稀疏地图构建、对计算资源要求较高的场景(如无人驾驶)。
比较总结
特性 | 直接法 | 间接法 |
---|---|---|
优化目标 | 光度误差 | 重投影误差 |
输入数据 | 图像的像素灰度/颜色信息 | 提取的特征点信息 |
初始值要求 | 需要良好的初始值 | 对初始值依赖较低 |
对光照变化的敏感性 | 敏感 | 不敏感 |
地图构建 | 适合稠密地图 | 多用于稀疏地图 |
算法复杂度 | 较低 | 较高 |
实用性 | 适合光滑、纹理少的场景 | 适合特征丰富、动态变化的场景 |
六自由度(6-DOF)
六自由度(6-DOF)指的是一个刚体在三维空间中可以进行的所有独立运动。这六个自由度包括:
三个平移自由度:沿x轴、y轴和z轴的平移。
三个旋转自由度:绕x轴、y轴和z轴的旋转。
对于移动平台(如无人机、机器人等),准确估计这六个自由度的状态是非常重要的,因为它们直接影响到平台的定位和姿态控制。
状态估计器
状态估计器是一种算法或模型,用于估计系统的内部状态。在VINS-Mono中,状态估计器的任务是根据传感器数据(如相机图像和IMU数据),估计平台的位置、速度、姿态等状态参数。常见的状态估计方法包括扩展卡尔曼滤波器(EKF)、粒子滤波器(PF)和非线性优化方法。
在机器人导航、自动驾驶、增强现实(AR)和虚拟现实(VR)等应用中,状态估计是核心模块之一,用于确定机器人或设备在环境中的位置和姿态。然而,由于传感器噪声和累积误差的影响,状态估计器在长时间运行中会逐渐失去准确性。为了解决这一问题,回环检测(Loop Closure Detection)、重定位(Re-localization)和全局优化(Global Optimization)成为不可或缺的组件。
消除漂移和累积误差的方法:
回环检测
回环检测是指系统在运行过程中,通过检测当前场景是否与先前访问过的场景相似,识别出“回到原处”的情况。例如,当机器人经过一条熟悉的走廊时,回环检测可以判断它曾经到过这里。一旦检测到回环,系统就可以利用这一信息修正漂移,重新调整当前位姿,使轨迹与先前的路径一致,从而大幅降低累积误差对估计结果的影响。
回环检测是指机器人识别出它曾经到达过的位置,从而形成一个闭环。在SLAM(Simultaneous Localization and Mapping)过程中,机器人通过不断估计自身位置并构建地图。然而,由于传感器噪声和累积误差,这些估计会逐渐偏离真实值。回环检测通过识别先前访问过的位置,提供了一个强约束,可以显著减少累积误差。具体来说,回环检测通过比较当前帧与历史帧的相似性来识别潜在的回环。一旦检测到回环,系统会利用这些信息进行全局优化,修正地图和轨迹的累积误差。
重定位
重定位是指在系统因漂移或其他原因导致状态估计不准确时,利用已知的地图或环境特征重新确定系统的当前位置。重定位与回环检测相辅相成,例如当系统在未知环境中导航时,回环检测提供的位置约束可以用于帮助重定位,而重定位则确保系统能够快速恢复正常运行状态,避免因误差积累而“迷路”。
重定位是指机器人在迷失位置后重新找到自己的位置。在实际应用中,机器人可能会因为突然的环境变化、传感器故障或其他原因而失去位置信息。重定位通过匹配当前观测到的特征与已知地图中的特征,帮助机器人重新确定自己的位置。重定位通常与回环检测紧密结合,因为在检测到回环后,机器人需要重新校正自己的位置。重定位不仅可以帮助机器人恢复位置信息,还可以减少累积误差,提高系统的鲁棒性。
全局优化
全局优化通过对整个轨迹的位姿进行统一调整,消除局部和全局的误差。具体来说,全局优化将回环检测生成的约束(即某些关键帧之间的关系)加入姿态图中,重新优化整条轨迹。这种方法可以显著提高轨迹和地图的精度,使得系统在长期运行中保持全局一致性。例如,机器人在探索一个大型建筑时,最终生成的地图会更加准确、连贯。
全局优化是指在整个地图和轨迹上进行优化,以确保全局一致性和准确性。在SLAM过程中,局部优化通常用于实时处理,但这些优化只能减少局部误差,无法消除全局累积误差。全局优化通过利用回环检测提供的强约束,对整个地图和轨迹进行优化,确保所有关键帧和地图点的位置都是一致的。常见的全局优化方法包括基于图优化的方法(如Bundle Adjustment,BA)和基于非线性优化的方法。这些方法通过最小化重投影误差和其他误差指标,使地图和轨迹达到全局最优。
地图重用需求的增加
随着导航和定位系统的应用范围扩大,地图重用需求正在不断增加。地图重用指的是在不同时间或任务中多次使用同一地图,以节省时间和计算资源。例如,机器人在一个工厂中每天都执行相同的巡检任务,重复构建地图会浪费资源。而通过保存和重用之前生成的地图,系统可以直接在已知环境中快速定位。
此外,地图重用还需要解决如何将当前构建的地图与已有地图合并的问题。这可以通过全局优化技术实现,确保新旧地图之间的无缝对接,从而生成一张更大、更精确的全局地图。
IMU初始化
短时间IMU预积分值的初始化策略
原理
利用短时间IMU预积分值进行初始化的基本思想是,通过短时间内的IMU数据(通常是陀螺仪和加速度计的测量值)来估计相机的相对旋转。具体来说,可以在短时间内(例如几秒钟)收集IMU数据,并对其进行预积分,得到相对旋转的估计值。这种方法假设在短时间内IMU的偏置和噪声影响较小,因此可以得到较为准确的相对旋转估计。
优点
快速初始化:由于只需要短时间的IMU数据,这种方法可以快速完成初始化,适用于需要快速启动的场景。
简单易实现:相对于复杂的初始化方法,这种方法实现起来较为简单,容易理解和实现。
局限性
不能建模陀螺仪偏置和图像噪声:这种方法假设在短时间内IMU的偏置和噪声影响较小,但实际上这些因素仍然存在并且会影响初始化的准确性。特别是陀螺仪的偏置如果不进行校准,会导致累积误差,影响后续的状态估计。
依赖于高质量的IMU数据:如果IMU数据质量不高,例如存在较大的噪声或偏置,这种方法的性能会显著下降。
单目惯性系统的封闭解及其改进
封闭解的提出
为了克服上述方法的局限性,一些研究者提出了单目惯性系统的封闭解方法。这些方法通过数学推导,直接从IMU和视觉数据中求解出系统的初始状态,包括相机的位姿、速度、重力向量等。封闭解方法的优点在于可以直接得到初始状态的精确解,而不需要进行复杂的迭代优化。
改进:陀螺仪偏置校准
尽管封闭解方法在理论上提供了精确的初始状态估计,但在实际应用中,陀螺仪的偏置仍然是一个重要的问题。为了进一步提高初始化的准确性,一些研究者提出了在封闭解基础上加入陀螺仪偏置校准的方法。具体来说,通过优化代价函数,同时估计初始状态和陀螺仪偏置,从而提高初始化的鲁棒性和准确性。
局限性
依赖长时间的IMU双重积分:为了准确估计陀螺仪偏置,通常需要在较长时间内收集IMU数据,并进行双重积分。这种方法虽然可以提高偏置估计的准确性,但也引入了更多的不确定度,特别是在长时间积分过程中,IMU的噪声和偏置会累积,影响最终的估计结果。
不能估计IMU积分的不确定度:尽管可以通过优化方法估计初始状态和陀螺仪偏置,但这种方法通常不能准确估计IMU积分的不确定度。这意味着在后续的状态估计中,可能会忽略掉这些不确定度,导致估计结果不够准确。
IMU 预积分
什么是预积分?
预积分(Preintegration)是IMU数据处理中一项重要技术,旨在高效利用高频IMU数据,同时减少重复计算的代价。IMU输出的加速度和角速度数据通常采样频率很高(例如200Hz),相机的采样频率较低(例如20Hz)。在两帧图像间(即相机两次采样之间),IMU数据可以通过积分来预测系统的运动状态,例如:
一次积分:从加速度推算速度。
二次积分:从加速度推算位移。
预积分的核心思想是将这些计算提前在局部参考坐标系中完成,并以紧凑的形式存储结果。这样,后续优化时无需重复计算积分,极大提高了计算效率。
预积分是针对惯性测量单元(IMU)数据的一种优化处理方法。IMU高频率采样加速度和角速度,理论上可以通过两次积分得到运动的速度和位移。然而,在实际视觉惯性导航系统(VINS)中,每次优化如果都重新从IMU原始数据进行积分计算,将导致极高的计算开销。
IMU预积分是指在处理IMU数据时,不是简单地直接使用原始测量值,而是先对IMU数据进行积分处理,以估计在两个关键帧之间的相对运动状态。预积分的目的是:
减少计算量:通过预积分,可以减少后端优化中的计算量,因为不需要在每个IMU测量点上都进行优化。
提高精度:预积分考虑了IMU的偏差和非线性效应,可以更准确地估计状态。
误差传播:预积分过程中计算了误差的传播,这对于后端优化中的状态估计非常重要。
预积分(Pre-integration)是指在IMU数据处理过程中,将连续的IMU测量值(加速度和角速度)在相邻关键帧之间进行积分,以减少计算负担并提高系统的实时性。
为什么要预积分?
避免重复计算
IMU数据通常采样频率很高,例如200Hz,而相机的采样频率可能只有20Hz。在两帧相机数据之间,IMU数据可能采样上百次。如果每次优化都要重新计算这些积分,计算代价非常高。
便于动态调整偏置
IMU测量的加速度和角速度通常会受到偏置影响,预积分可以通过一阶线性化模型快速修正偏置:
不需要重新从原始IMU数据进行积分。
支持紧耦合优化
在VINS中,IMU预积分值作为视觉帧间约束的残差参与滑动窗口优化,方便融合IMU与视觉数据,提高最终位姿估计的精度。
IMU预积分是为了减少IMU数据的累积误差,并提高计算效率而采用的一种技术。具体来说:
累积误差:IMU数据通常包含噪声和偏差,长时间积分会导致累积误差。通过预积分,可以将一段时间内的IMU数据转换为一个等效的增量值,从而减少误差。
计算效率:预积分可以减少每次处理大量IMU数据的计算负担,提高系统的实时性。
预积分的具体步骤如下:
- 采样:在每个IMU采样周期内,记录加速度和角速度数据。
- 积分:对加速度和角速度数据进行积分,计算出在这段时间内的位移和旋转增量。
- 等效增量:将这些增量值作为一个整体,用于后续的状态估计。
预积分的过程示例
优化中如何利用预积分?
紧耦合
紧耦合是指将不同传感器的数据紧密结合起来,进行联合优化,以提高系统的估计精度。在VINS-Mono中,紧耦合主要体现在以下几个方面:
- 联合优化:将IMU预积分值和相机观测值同时纳入优化目标函数,通过非线性优化方法(如LM算法或Gauss-Newton算法)联合求解系统的状态参数。
- 一致性约束:确保IMU和相机数据之间的一致性,避免由于传感器数据不一致导致的误差。
具体来说,紧耦合的优化目标函数可以表示为:
回环检测
回环检测是指机器人识别曾到达某场景,使得地图闭环的能力。在SLAM系统中,回环检测用于检测机器人是否回到了先前访问过的位置,从而减少累积误差,提高地图的全局一致性。
回环检测(Loop Detection)是一种在SLAM(Simultaneous Localization and Mapping,同时定位与建图)系统中识别机器人是否回到之前访问过的位置的技术。
回环检测的关键在于有效检测出相机是否曾经经过同一个地方,这样可以避免较大的累积误差,并使得当前帧和之前的某一帧迅速建立约束,形成新的较小的累积误差。VINS-Mono使用DBoW2(一种词袋位置识别方法)进行回环检测。它从图像中抽取500个特征角点并计算其BRIEF描述子,这些描述子用作视觉词袋在数据库里进行搜索,以识别是否曾经访问过相同的地方。
紧耦合优化是指将回环检测与系统的其他部分(如位姿图优化)紧密结合,共同优化。具体实现如下:
- 特征提取与匹配:从图像中提取特征点(如ORB特征点),并使用词袋模型(BoW)或其他方法(如深度学习)进行特征匹配,找到可能的回环候选帧。
- 相似性评估:通过计算候选帧与当前帧之间的相似度(如TF-IDF),评估回环的可能性。
- 位姿优化:一旦检测到回环,通过优化方法(如Sim3变换)计算回环帧与当前帧之间的相对位姿,并更新位姿图。
重定位计算代价很小的原因
紧耦合:回环检测与位姿图优化紧密结合,减少了不必要的计算步骤。
高效匹配:使用词袋模型或其他高效的特征匹配方法,减少了匹配时间。
局部优化:在检测到回环后,只对局部地图进行优化,而不是全局优化,减少了计算量。
重定位的计算代价很小,因为VINS-Mono的回环检测模块与紧耦合优化相结合,可以高效地将滑动窗口的帧与过去的姿态关联在一起。在重定位时,回环的帧(滑动窗口中的帧)设为固定帧,这样可以很轻易地把回环帧的残差添加进优化中,从而实现重定位。
四自由度什么意思?
针对漂移问题,固定滚转角和俯仰角,仅优化位置和航向角,实现全局地图的统一和一致性。
姿态图是什么?
什么是姿态图?
姿态图(Pose Graph)是一种数据结构,用于表示机器人或相机在不同时间点的姿态(位置和方向)。在SLAM中,姿态图将机器人的路径表示为节点,节点之间的边表示连续姿态之间的变换。
姿态图是一种用于表示机器人或相机在空间中位置和姿态的图,其中的节点代表位姿(位置和方向),边代表位姿之间的关系。
姿态图(Pose Graph)是一种用于表示机器人或相机在环境中的运动轨迹的数据结构。在SLAM(Simultaneous Localization and Mapping,同步定位与建图)系统中,姿态图被广泛用于优化机器人的轨迹和构建地图。姿态图通过图的形式表示机器人的各个位姿(pose)及其之间的相对关系。
姿态图的结构
节点(Nodes):每个节点表示一个关键帧(keyframe),包含机器人的位姿信息(位置和姿态)。通常,位姿信息可以用6自由度(6-DOF)表示,即三个位置坐标(x, y, z)和三个旋转坐标(通常用四元数表示)。
边(Edges):每条边表示两个节点之间的相对位姿关系,即从一个节点到另一个节点的相对变换。边通常包含一个相对位姿估计和一个协方差矩阵,表示估计的不确定性。
姿态图的实现
构建姿态图
关键帧选择:在SLAM系统中,不是所有的帧都会存储下来,而是选择一些关键帧来代表整个地图。这些关键帧会作为姿态图的节点。
- 视觉特征:通过视觉特征(如SIFT、ORB等)检测和匹配,选择具有足够特征点的帧作为关键帧。
- 时间间隔:每隔一段时间选择一个关键帧。
- 运动变化:当机器人发生较大运动变化时,选择一个关键帧。
位姿估计:
- 视觉里程计:通过特征点匹配和三角化方法,估计相邻关键帧之间的相对位姿。
- IMU数据:结合IMU数据(加速度计和陀螺仪),进行预积分,估计位姿变化。
- 回环检测:通过特征点匹配和地图匹配,检测回环,即机器人是否回到了先前访问过的位置。
构建边:
- 相对位姿:计算每个关键帧之间的相对位姿,作为边的权重。
- 协方差矩阵:估计相对位姿的不确定性,用协方差矩阵表示。
- 姿态图的边表示相邻关键帧之间的相对位姿。这些边可以是欧氏变换(包含平移和旋转)或相似变换(只包含旋转和缩放),具体取决于系统的需要和传感器的特性。
优化姿态图
非线性优化:
- 目标函数:定义一个目标函数,通常是最小化所有边的误差平方和。
- 优化算法:使用非线性优化算法(如Levenberg-Marquardt、Gauss-Newton等)优化目标函数,调整节点的位姿,使地图达到全局一致性。
约束条件:
- 闭环约束:通过回环检测,添加闭环约束,使地图中的重复区域对齐。
- 先验约束:利用已知的先验信息(如GPS数据、地图数据等),添加先验约束,提高优化的准确性。
地图构建
点云融合:
- 点云生成:每个关键帧生成一个局部点云。
- 点云对齐:通过优化后的位姿,将所有局部点云对齐,生成全局点云地图。
地图优化:
- 全局优化:通过全局优化,进一步提高地图的精度和一致性。
- 地图管理:管理地图的存储和更新,确保地图的高效性和实时性。
全局一致的地图
为什么四自由度的姿态图优化可以取得全局一致的地图?
四自由度的姿态图优化关注于旋转,这有助于校正全局地图中的累积旋转误差。由于旋转误差比平移误差更容易累积,优化旋转可以更好地保持地图的全局一致性。
减少变量:相比于六自由度(6-DOF)优化,四自由度优化减少了变量数量,简化了优化问题。
尺度一致性:通过优化尺度自由度,可以确保地图的尺度一致性,减少累积误差。
局部优化:通过局部优化,逐步改进地图的整体一致性。
地图合并
为什么通过姿态图优化,可以将当前地图和之前保存的地图进行合并
地图合并是指将当前地图与之前保存的地图进行融合,以扩大地图的覆盖范围和提高地图的精度。具体实现如下:
- 回环检测:检测当前地图中的关键帧与之前保存地图中的关键帧之间的回环。回环检测提供了闭环约束,这些约束在姿态图优化中被用来校正漂移,使得当前地图与之前地图对齐。
- 相对位姿计算:通过优化方法(如Sim3变换),计算回环帧之间的相对位姿。
- 地图对齐:将当前地图与之前保存的地图对齐,使它们在全局坐标系中一致。
- 全局优化:通过全局优化,确保合并后的地图达到全局一致性。姿态图优化考虑了整个路径上的所有姿态,这允许系统在全局范围内调整姿态,以最小化累积误差。
前端和后端
在VINS-Mono(或类似的视觉惯性导航系统)中,前端和后端分别指的是系统中不同的功能模块,它们的职责和处理数据的方式有显著差异。以下是两者的详细解释和VINS-Mono中的具体实现。
前端和后端的概念
前端(Frontend)
前端主要负责传感器数据的初步处理和特征提取,目的是为后端提供必要的数据输入。
处理内容:
从传感器中采集原始数据(如相机图像和IMU数据)。
进行数据预处理,例如特征点提取和跟踪、IMU预积分计算等。
输出视觉特征、IMU预积分结果以及相关初步估计结果。
前端的特点:
计算量相对较低,主要在传感器采集的帧率下运行。
注重实时性,确保结果能够迅速传递给后端。
输出是中间结果,可能不够精确,仍需后端优化。
后端(Backend)
后端主要负责全局的非线性优化,目标是对前端的初步结果进行进一步优化,以提高系统的精度和一致性。
处理内容:
基于前端提供的视觉特征和IMU数据,建立优化问题(如滑动窗口优化)。
利用非线性优化技术(如BA或图优化)求解相机位姿、IMU状态和其他参数(如IMU偏置)。
执行全局调整,如回环检测后的全局位姿图优化。
后端的特点:
计算量大,注重全局一致性和精度。
能够处理漂移等长期积累的问题(如回环检测和重定位)。
不一定实时运行,但需要对前端的结果进行纠正和完善。
VINS-Mono中的前端和后端
前端在VINS-Mono中的实现
VINS-Mono的前端主要处理视觉和惯性数据,具体任务包括:
视觉处理:
使用稀疏光流(KLT光流)算法跟踪特征点。
检测新特征点,并执行RANSAC进行异常点剔除。
维护关键帧(Keyframe),确保关键帧之间有足够的视差,以支持后续三角化。
IMU数据预积分:
计算相机帧之间的IMU预积分值,包括位置增量、速度增量和旋转增量。
处理IMU偏置,生成用于后端优化的初步残差。
前端输出:
视觉特征点的位置和匹配信息。
IMU预积分结果。
初步的位姿估计,用于滑动窗口优化的初始值。
后端在VINS-Mono中的实现
VINS-Mono的后端以滑动窗口优化为核心,通过非线性优化来整合前端数据,具体任务包括:
滑动窗口优化(VIO):
滑动窗口包含多个关键帧的IMU状态(位置、速度、姿态)和特征点信息。
根据前端提供的视觉观测和IMU预积分结果,构建残差方程。
最小化残差(如IMU残差、视觉重投影误差),优化系统状态。
回环检测和重定位:
检测是否回到已访问过的场景,通过几何一致性约束重新定位。
利用回环检测结果,执行全局位姿图优化,消除长期漂移。
全局优化(姿态图优化):
固定滚转角和俯仰角,只对位置和航向角进行优化,确保全局一致性。
允许地图保存和重用,通过合并历史地图与当前地图生成全局地图。
后端输出:
精确的当前位姿估计。
长期一致的全局地图和轨迹。
前端与后端的协作:一个实例
场景描述
假设一个无人机使用VINS-Mono在室内导航,当前它从位置A飞到位置B:
前端的工作:
相机采集的图像中,前端检测并跟踪了多个角点(如墙壁上的纹理)。
使用IMU数据进行短时间内的预积分,预测从A到B之间的位移。
输出初步估计:无人机从A移动了3米,方向朝北偏东。
后端的工作:
后端以滑动窗口优化为核心,利用前端的视觉观测和IMU数据,优化位置和姿态。
检测到无人机在位置B处看到了位置A的场景(回环检测),调整轨迹,修正漂移。
输出精确结果:无人机从A移动到B实际上是2.8米,方向稍偏北。
总结
在VINS-Mono中,前端快速处理传感器数据,生成中间结果;后端通过优化确保结果的全局一致性和精度。这种分工能够平衡实时性和精确性,是高效实现视觉惯性导航系统的关键设计理念。
欧拉角
滚转角(Roll)、俯仰角(Pitch)和航向角(Yaw)是描述三维空间中物体姿态(Orientation)的三个角度,统称为欧拉角(Euler Angles)。它们分别定义物体绕自身坐标系三个轴的旋转。
滚转角(Roll)
定义:滚转角描述物体绕自身**前后轴(通常是X轴)**的旋转角度。
常见场景:飞机的左右侧倾。
例子:
如果无人机的左侧翅膀向下倾斜,右侧翅膀向上翘起,滚转角就会偏离水平。
俯仰角(Pitch)
定义:俯仰角描述物体绕自身**左右轴(通常是Y轴)**的旋转角度。
常见场景:飞机的机头向上抬起或向下低落。
例子:
当无人机从水平飞行转为向上爬升时,俯仰角会增大。
航向角(Yaw)
定义:航向角描述物体绕自身**垂直轴(通常是Z轴)**的旋转角度。
常见场景:船舶或汽车的方向转向,飞机在水平面内的左右旋转。
例子:
如果无人机从面朝北转为面朝东,它的航向角会发生变化。
理解欧拉角的整体概念
欧拉角可以用来描述物体在三维空间中的任何姿态。
它们是以特定的旋转顺序定义的(如Roll -> Pitch -> Yaw)。
每个角的值都有方向:顺时针通常为正,逆时针为负(具体以定义坐标系为准)。
Ceres Solver
Ceres Solver [1] 是一个开源 C++ 库,用于大型复杂优化问题的建模和求解。它可以用来解决边界约束的非线性最小二乘问题和一般的无约束优化问题。
https://izhengfan.gitbooks.io/ceres-solver-cn/content/
RANSAC
RANSAC(RANdom SAmple Consensus)是一种迭代算法,用于从一组观测数据中估计数学模型的参数,同时识别和排除异常值(外点)。RANSAC 在计算机视觉、机器人学和其他领域中广泛应用,特别是在特征匹配、图像拼接、相机标定等任务中。
RANSAC 算法的基本步骤
随机选择样本:
随机选择一组最小的数据点(样本),这些点用于拟合模型。
拟合模型:
使用选定的样本点拟合模型(例如,基本矩阵、单应矩阵等)。
评估模型:
使用剩余的数据点(未被选中的点)评估模型的拟合程度。通常通过计算这些点与模型预测值之间的误差来评估。
确定内点:
如果误差小于某个预设的门限值(阈值),则认为该点是内点(inlier),否则认为是外点(outlier)。
重复迭代:
重复上述步骤多次,每次选择不同的样本点,找到具有最多内点的模型。
最终模型:
选择具有最多内点的模型作为最终模型。
门限值的作用
在 RANSAC 算法中,门限值(threshold)是一个关键参数,用于区分内点和外点。具体来说:
误差评估:
计算每个数据点与模型预测值之间的误差。这个误差可以是欧氏距离、代数距离或其他度量。
内点识别:
如果误差小于门限值,该点被认为是内点;否则,被认为是外点。
模型选择:
选择具有最多内点的模型作为最终模型。
为什么需要门限值?
减少噪声影响:
门限值有助于排除由于噪声或错误匹配引起的外点,从而提高模型的鲁棒性和准确性。
提高模型质量:
通过设置合理的门限值,可以确保模型主要基于可靠的内点拟合,从而提高模型的质量。
控制计算复杂度:
适当的门限值可以减少不必要的计算,提高算法的效率。
Eigen
Eigen 是一个高效的 C++ 模板库,用于线性代数计算。它提供了丰富的数学功能,包括矩阵运算、向量运算、几何变换、数值求解器等。Eigen 的设计目标是提供高性能、易用性和灵活性,使其成为许多科学计算、计算机视觉、机器学习和其他领域的首选库之一。
主要特点
高效性:
Eigen 使用模板元编程技术,能够在编译时生成高度优化的代码。
支持 SIMD(单指令多数据)指令集,如 SSE、AVX 和 NEON,以提高计算速度。
内存布局优化,减少内存访问开销。
易用性:
提供直观的 API,使得线性代数操作非常简洁和自然。
支持多种数据类型,包括浮点数、整数和复数。
动态和静态大小的矩阵和向量支持。
灵活性:
可以轻松地扩展和自定义,支持用户定义的数据类型和表达式。
支持多种矩阵存储格式,如密集矩阵、稀疏矩阵和对角矩阵。
广泛的数学功能:
基本的矩阵和向量运算,如加法、减法、乘法、转置等。
高级线性代数操作,如特征值分解、奇异值分解、LU 分解、QR 分解等。
几何变换,如旋转、平移和仿射变换。
数值求解器,如线性方程组求解和最小二乘法。
使用
在你的 C++ 项目中包含 Eigen 头文件,并使用其提供的类和函数。
#include <Eigen/Dense>
int main() {
// 创建一个 2x2 的矩阵
Eigen::Matrix2d matrix;
matrix << 1, 2,
3, 4;
// 创建一个 2 维向量
Eigen::Vector2d vector;
vector << 1, 2;
// 矩阵和向量的乘法
Eigen::Vector2d result = matrix * vector;
// 输出结果
std::cout << "Result of matrix * vector: " << result.transpose() << std::endl;
return 0;
}
示例
矩阵运算
#include <Eigen/Dense>
#include <iostream>
int main() {
// 创建两个 3x3 的矩阵
Eigen::Matrix3d matrix1;
matrix1 << 1, 2, 3,
4, 5, 6,
7, 8, 9;
Eigen::Matrix3d matrix2;
matrix2 << 9, 8, 7,
6, 5, 4,
3, 2, 1;
// 矩阵相加
Eigen::Matrix3d sum = matrix1 + matrix2;
// 矩阵相乘
Eigen::Matrix3d product = matrix1 * matrix2;
// 输出结果
std::cout << "Sum of matrices:\\n" << sum << std::endl;
std::cout << "Product of matrices:\\n" << product << std::endl;
return 0;
}
特征值分解
#include <Eigen/Dense>
#include <iostream>
int main() {
// 创建一个 3x3 的矩阵
Eigen::Matrix3d matrix;
matrix << 1, 2, 3,
4, 5, 6,
7, 8, 9;
// 计算特征值和特征向量
Eigen::EigenSolver<Eigen::Matrix3d> eigensolver(matrix);
Eigen::Matrix3cd eigenvectors = eigensolver.eigenvectors();
Eigen::Vector3cd eigenvalues = eigensolver.eigenvalues();
// 输出结果
std::cout << "Eigenvalues:\\n" << eigenvalues << std::endl;
std::cout << "Eigenvectors:\\n" << eigenvectors << std::endl;
return 0;
}
原文地址:https://blog.csdn.net/qq_42759162/article/details/144190502
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!