自学内容网 自学内容网

【保姆级教程】LSS (1):Lift Splat Shoot 代码详解

如果只看论文,估计很多人看完论文后还是一头雾水,根本不知道LSS到底是怎么实现的。接下来我们就结合代码对LSS的每个步骤进行详细解析。

LSS模型被封装在src/model.py文件中的LiftSplatShoot类中,模型用Nuscense数据集进行训练,每次输入车身环视6个相机的图像。Nuscense数据集中的原始图像宽高为1600x900,在预处理的时候被缩放到352x128的大小,6个相机的图像经过预处理后组成一个维度为(B=1,N=6,C=3,H=128,W=352)的张量输入给LSS模型。前向推理时,LiftSplatShoot类的forward函数需要输入以下几个参数:

  • x : 6个相机的图像组成的张量,(1,6,3,128,352)
  • rots : 6个相机从相机坐标系到自车坐标系的旋转矩阵,(1,6,3,3)
  • trans : 6个相机从相机坐标系到自车坐标系的平移向量,(1,6,3)
  • intrins : 6个相机的内参矩阵,(1,6,3,3)
  • post_rots : 6个相机的图像因预处理操作带来的旋转矩阵,

原文地址:https://blog.csdn.net/m0_51579041/article/details/140728086

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!