【视觉SLAM】1-概述

🕗 发布于 2024-11-15 19:07 slam

读书笔记

文章目录

1. 经典视觉SLAM框架
2. 数学表述

1. 经典视觉SLAM框架

在这里插入图片描述

传感器信息读取：相机图像、IMU等多源数据；
前端视觉里程计（Visual Odometry，VO）：估计相机的相对运动，生成局部地图，VO又称为前端（Front End）；
后端非线性优化（Optimization）：接收不同时刻VO测量的相机位姿、回环检测信息，进行联合优化，得到全局一致的轨迹和地图，又称为后端（Back End）；
回环检测（Loop Closure Detection）：判断机器人是否到达过先前的位置，若检测到回环，则把信息交由后端处理（对VO轨迹产生的累积漂移（Accumulating Drift）误差进行校正）；
建图（Mapping）：根据估计的轨迹，建立与任务要求对应的地图。

SLAM中地图的形式主要分为度量地图和拓扑地图两种：

度量地图（Metric Map)：强调精确表示地图中物体的位置关系，通常用稀疏（Sparse）与稠密（Dense）对其分类。选择一部分具有代表意义的物体称为路标（Landmark)（特征点、点云？）；
拓扑地图（Topological Map)：强调地图元素之间的关系，它是一个图（Graph），由节点和边组成，只考虑节点间的连通性。

2. 数学表述

对于由相机和各类传感器如IMU组成的机器人来说，其在环境中的运动数据可通过两个途径获得：①由传感器数据估计，称为运动；②由相机图像数据估计，称为观测。为了对这两个过程进行数学表述，做如下定义：

在机器人的连续时间运动内取离散时刻 $\cdots, K$ ；
用 $x$ 表示机器人自身位置，则其各时刻位置记为 $x_1, \cdots, x_K$ ；
$N$ 个路标点表示为 $y_1, \cdots, y_N$ ；

分别用运动方程 $f(\cdot)$ 和观测方程 $h(\cdot)$ 来描述上述两个过程，这两个函数都是一种通用方程表示，这里不用纠结其具体表达式。

2.1 运动方程

$x_k=f(x_{k-1},u_k,\omega_k)$
其中， $u_k$ 为运动传感器的输入， $\omega_k$ 为该过程的噪声。

2.2 观测方程

机器人在 $x_k$ 位置看到路标 $y_j$ 时，产生观测数据 $z_{k,j}$ ：
$z_{k,j}=h(y_j,x_k,v_{k,j})$
其中， $v_{k,j}$ 为观测噪声。

2.3 问题抽象

上述两方程描述了最基本的SLAM问题：已知运动测量读数 $u$ 、传感器读数 $z$ 时，如何求解定位问题（估计 $x$ ）和建图问题（估计 $y$ ）？

这时，可把SLAM问题建模成一个状态估计问题：如何通过带有噪声的测量数据，估计内部的、隐藏的状态变量。

按照运动和观测方程是否为线性、噪声是否服从高斯分布进行分类，上述状态估计问题可分为线性/非线性和高斯/非高斯系统。其中线性高斯系统（Linear Gaussian，LG）最简单，其无偏的最优估计可由卡尔曼滤波（Kalman Filter，KF）给出；而复杂的非线性非高斯系统（Non-Linear Non-Gaussian，NLNG）中，可使用扩展卡尔曼滤波器（Extended Kalman Filter，EKF）和非线性优化两大类方法求解。

原文地址：https://blog.csdn.net/cfan927/article/details/143758235

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

FPGA 第7讲简单组合逻辑译码器
经过验证对比发现两种方法虽然最后实现的功能是一样的，而所得到的 RTL 视图差别较大，但最后的逻辑资源使用却是相同的（时序逻辑中不一定相同），说明综合器进行了适当的优化。if-else 的这种写法是存
阅读更多2024-11-16
梧桐杯初赛入围（人工智能赛道） 15 / 100
本项目开发了一套先进的医疗问答系统，该系统融合了 Reinforced Attention Generator (RAG) 技术与大模型，旨在通过精确的知识检索和问答生成技术，显著提升心理健康咨询系统
阅读更多2024-11-16
faiss 提供了多种索引类型
faiss 多种索引类型
阅读更多2024-11-16
物联网低功耗广域网LoRa开发(二)：LoRa开发环境搭建及驱动移植
【代码】物联网低功耗广域网LoRa开发(二)：LoRa开发环境搭建及驱动移植。
阅读更多2024-11-16
【隐私计算】隐私计算的应用场景探索(大模型隐私计算、隐私数据存储计算、Web3、隐私物联网等)
隐私计算、隐私保护、大模型安全、大模型隐私推理、数据安全、数据隐私、web3、分布式网络、去中心化网络、隐私数据存储、大厂数据保护、隐私计算应用探索
阅读更多2024-11-16
EHOME视频平台EasyCVR多品牌摄像机视频平台监控视频编码H.265与Smart 265的区别？
Smart 265和Smart 264的区别是一个是在H.264编码基础上，一个是在H.265编码基础上，其作用都是在当前码率参数下进一步节省码流，如果你摄像头图像上运动画面越少，静止画面越多，则码率
阅读更多2024-11-16
软件测试基础二十九（接口测试 mock）
软件测试基础之接口测试 mock
阅读更多2024-11-16
《FreeRTOS任务基础知识以及任务创建相关函数》
FreeRTOS学习日志（4）--FreeRTOS任务基础知识以及任务创建相关函数
阅读更多2024-11-16
dlopen: cannot load any more object with static TLS & sklearn, HPOBench, smac3
成功解决：升级glibc版本到2.23。
阅读更多2024-11-16
2024年11月15日Github流行趋势
项目名称：MinerU项目名称：exo项目名称：nvm项目名称：kotaemon项目名称：VideoLingo项目名称：motion项目名称：primeng项目名称：bbot项目名称：es-toolk
阅读更多2024-11-16