计算机视觉——Intel RealSense D435的使用及python环境下的实现

🕗 发布于 2024-11-12 05:33 计算机视觉 python

什么是深度相机，以及深度相机的分类和工作原理

深度相机是一种能够捕捉场景中物体的深度信息（即物体与相机之间的距离）的设备。与传统的二维相机不同，深度相机除了拍摄图像的颜色和亮度外，还能生成一个关于场景中每个像素距离相机的深度数据，通常称为“深度图”。

深度相机根据其工作原理和技术不同，可以分为几种主要类型，每种类型的深度捕捉方式和适用场景也有所不同。以下是常见的深度相机分类：

立体视觉相机（Stereo Vision Camera）
- 原理：通过两台或多台相机从不同角度拍摄同一场景，利用视差来计算每个像素的深度信息。通过对比两张图像中的相同点，计算出物体的三维空间位置。
结构光相机（Structured Light Camera）
- 原理：通过投射已知的光模式（如条纹、网格等）到物体表面，然后通过相机捕捉光模式的变形情况，基于变形计算出物体表面的深度信息。
时间飞行（ToF, Time-of-Flight）相机
- 原理：通过发射激光束并接收激光反射回来的时间来计算物体与激光发射器之间的距离。激光雷达一般具有高精度和较远的测距能力。
RGB-D相机
- 原理：RGB-D相机结合了传统的RGB相机（彩色图像）和深度传感器（如结构光或ToF）来同时捕捉场景的颜色和深度信息。D代表的是深度（Depth）。

Intel RealSense D435介绍

Intel RealSense D435 是 Intel 推出的一款高性能深度相机，属于 RealSense 系列产品的一部分。它结合了深度传感技术和 RGB 图像捕捉功能，广泛应用于机器人、增强现实（AR）、虚拟现实（VR）、计算机视觉、三维扫描等多个领域。Intel RealSense D435 是一款功能强大、性能均衡的深度相机，适用于许多计算机视觉、机器人、AR/VR 以及其他需要实时深度感知的应用。

在这里插入图片描述

工作原理

左右红外相机（接收器）分贝产生两幅也就是左侧和右侧ir灰度图像，中间红外点阵发射器（红外散斑）相当于补光灯，进而可以得到点云。红外点阵发射器强度可调，是否发射也可调，不打开也能测深度，只是效果不好。最右边的rgb相机用于采集彩色图片，最终可以将彩色视频流与深度流进行对齐。
- 左右红外相机（接收器）
  - 红外灰度图像：RealSense D435 使用左右两个红外相机（IR 摄像头）来采集深度数据。由于它们相互间有一定的基线（距离），这使得系统能够通过比较图像中的视差来估算每个像素的深度信息。这些相机捕捉的图像通常是 灰度图像，即只包含深度信息，而不包含颜色信息。
  - 视差计算：左右红外相机拍摄的图像之间的像素差异（视差）用于计算场景中物体的距离。通过对这两个图像中的相同特征点进行匹配，系统可以推算出每个点的深度，从而生成深度图。
- 红外点阵发射器（红外散斑）
  - 功能：中间的 红外点阵发射器 通常用于生成 红外光散斑，这是一种已知模式的红外光，通过投射到物体表面，辅助深度计算。点阵发射器的作用类似于一种 补光灯，在低光或无光环境下帮助相机更好地捕捉深度数据。
- 点云生成
  - 点云（Point Cloud）：通过左右红外相机捕获的深度数据和红外点阵发射器的辅助光源，RealSense D435 可以生成一个 三维点云，这个点云表示了物体的三维空间坐标，通常每个点都具有 (x, y, z) 坐标，且与场景中的物体表面相对应。
  - 点云数据：这个三维点云数据可以用于物体识别、三维建模、环境扫描、手势识别等各种高级视觉任务。
- RGB相机
  - 彩色图像采集：最右侧的 RGB 相机 负责采集场景的 彩色图像。RGB 摄像头和红外传感器（立体视觉和红外点阵发射器）配合工作，通常会提供 彩色视频流，并与深度流进行对齐，得到 彩色深度图。这个过程可以通过硬件或软件实现图像与深度信息的 对齐（alignment），即将每个深度图中的点与对应的彩色像素匹配。

windows中如何使用Intel RealSense D435

https://github.com/IntelRealSense/librealsense/blob/master/doc/distribution_windows.md

可视化界面（Intel RealSense Viewer）的安装以及SDK的安装可以参照官方指南。装SDK会附带安装可视化界面Viewer、Examples和Depth Quality Tool。

在这里插入图片描述

只用装一个SDK就行，会自动给你装上可视化viewer和tool

在这里插入图片描述

点下一步下一步就行。安装完成后就可以看到深度图和彩色图

在这里插入图片描述

在python中调用深度相机

首先在windows下安装anaconda和pycharm,然后配置open3d新环境。（这个自己找资源配置）
创建一个新的环境，python 版本按你的需求，我的是3.11
```
conda create -n 你的环境名字 python=3.11
```
配置opencv环境，安装opencv，我这里都下的最新的包
```
pip install opencv-python
pip install opencv-contrib-python
```
接着安装open3d和pyrealsense2，open3d需要等很长时间。
```
pip install open3d
pip install pyrealsense2
```
之后我们就需要把Intel RealSense D435的包下的 SDK 文件复制到我们的环境下，我这里SDK文件所在是：D:\A_My_Project\robot\deep_camera\Intel RealSense SDK 2.0\bin\x64，然后把pyd和dll文件（如图）复制到我们python环境下，D:\anaconda3\envs\cv\DLLs（这里是因为我们用的anconda创建的环境，如果是单独的python环境需要找到对应的目录下）。

打开pycharm即可测试，代码和效果如下：

import pyrealsense2 as rs
import numpy as np
import cv2

if __name__ == "__main__":
    # Configure depth and color streams
    pipeline = rs.pipeline()
    config = rs.config()
    config.enable_stream(rs.stream.depth, 640, 480, rs.format.z16, 30)
    config.enable_stream(rs.stream.color, 640, 480, rs.format.bgr8, 30)
    # Start streaming
    pipeline.start(config)
    try:
        while True:
            # Wait for a coherent pair of frames: depth and color
            frames = pipeline.wait_for_frames()
            depth_frame = frames.get_depth_frame()
            color_frame = frames.get_color_frame()
            if not depth_frame or not color_frame:
                continue
            # Convert images to numpy arrays

            depth_image = np.asanyarray(depth_frame.get_data())

            color_image = np.asanyarray(color_frame.get_data())

            # Apply colormap on depth image (image must be converted to 8-bit per pixel first)
            depth_colormap = cv2.applyColorMap(cv2.convertScaleAbs(depth_image, alpha=0.03), cv2.COLORMAP_JET)
            # Stack both images horizontally
            images = np.hstack((color_image, depth_colormap))
            # Show images
            cv2.namedWindow('RealSense', cv2.WINDOW_AUTOSIZE)
            cv2.imshow('RealSense', images)
            key = cv2.waitKey(1)
            # Press esc or 'q' to close the image window
            if key & 0xFF == ord('q') or key == 27:
                cv2.destroyAllWindows()
                break
    finally:
        # Stop streaming
        pipeline.stop()

在这里插入图片描述

你可以进这个github项目进行案例学习

在这里插入图片描述
github官网地址：https://github.com/IntelRealSense/

官方文档：https://dev.intelrealsense.com/docs/docs-get-started

官方API：https://intelrealsense.github.io/librealsense/python_docs/_generated/pyrealsense2.html#module-pyrealsense2

原文地址：https://blog.csdn.net/weixin_46824709/article/details/143693707

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Linux：测试指令test
下一篇：c# onnx 调用yolo v11进行目标检测

关于强化学习的一份介绍
假设你在一家赌场里面对一台有 k 个摇臂的老虎机，每个摇臂都有不同的中奖概率。每次拉其中一个摇臂，你都会得到一个奖励（通常是金钱）。你的目标是在有限次尝试内最大化累计奖励。在这个问题中，“摇臂”代表不
阅读更多2024-11-17
ADS学习笔记 5. 微带天线设计
ADS学习笔记 5. 微带天线设计
阅读更多2024-11-17
D70【 python 接口自动化学习】- python 基础之数据库
1. 使用Python实现读取写入数据库操作ps.今天去看航展了，歼20简直不要太快，明天再来补作业~
阅读更多2024-11-17
AI写作（十）发展趋势与展望（10/10）
例如，在阅读一篇复杂的文章时，AI 写作工具可以提取出关键信息，让学生快速掌握文章的核心内容。AI 写作助手可以根据用户输入的主题和要求，自动生成文章的大纲和结构，帮助学生和教师快速了解文章的主要内容
阅读更多2024-11-17
用户自定义IP核——ZYNQ学习笔记6
通过自定义一个 LED IP 核，通过 PS 端的程序来控制底板上 PL 端 LED1 呈现呼吸灯的效果，并且 PS 可以通过 AXI 接口来控制呼吸灯的开关和呼吸的频率。
阅读更多2024-11-17
从零开始学习 sg200x 多核开发之 eth0 自动使能并配置静态IP
本文将介绍如何通过配置文件启动自动使能有线网络。
阅读更多2024-11-17
软考之RESTful 架构的特点
为了实现前后端分离，首先需要设计并定义 RESTful API。API 应该清晰地定义每个资源的 URI、支持的 HTTP 方法、请求和响应的格式等。资源建模：识别系统中需要哪些资源，并为每个资源分配
阅读更多2024-11-17
C++初阶——优先队列
/创建一个默认的优先队列//默认是priority_queue<int,vector<int>,less<int>()> pq1;//改为小根堆return 0;
阅读更多2024-11-17
【AI图像生成网站&Golang】JWT认证与令牌桶算法
在 JWT 中，Payload 就是 Token 的核心数据部分，用来存储那些需要在两方之间传递的信息。它包含了自定义的声明（Claims），例如用户的标识（user_id）或过期时间（exp）。单位
阅读更多2024-11-17
怎样遵守编程规范，减少和控制C++编程中出现的bug？
通过遵循 C++ 标准和最佳实践、编写规范的代码、进行防御性编程、使用静态分析和代码审查、编写单元测试和回归测试，以及记录日志和使用调试工具，你可以有效地减少和控制 C++ 编程中出现的 bug。这些
阅读更多2024-11-17

计算机视觉——Intel RealSense D435的使用及python环境下的实现

什么是深度相机，以及深度相机的分类和工作原理

深度相机根据其工作原理和技术不同，可以分为几种主要类型，每种类型的深度捕捉方式和适用场景也有所不同。以下是常见的深度相机分类：

Intel RealSense D435介绍

windows中如何使用Intel RealSense D435

在python中调用深度相机

你可以进这个github项目进行案例学习

相关文章