基于RealSense D435相机实现手部姿态重定向

🕗 发布于 2024-09-26 06:37 相机机器人

基于Intel RealSense D435 相机和 MediaPipe的手部姿态检测，进一步简单实现手部姿态与机器人末端的重定向。
假设已经按照【基于 RealSenseD435i相机实现手部姿态检测】配置好所需的库和环境，并且有一个可以控制的机器人接口。

一、手部姿态重定向介绍

手部姿态重定向通常涉及将实时手部关键点映射到虚拟环境或另一个坐标系中（通常需要映射到机器人坐标系中）。可以使用以下步骤实现基本的手部姿态重定向：

获取关键点坐标：使用手部追踪库（如 MediaPipe）获取手部关键点的坐标。
具体包括数据获取和手部特征识别。
首先选择合适的相机，如RGB相机、深度相机（如Kinect或RealSense），或高帧率摄像头获取实时图像或深度数据；
然后使用机器学习或深度学习算法（如YOLO、SSD等）检测图像中的手部，也可以使用现成的手部检测模型，例如MediaPipe Hands，来实现实时手部跟踪；
最后提取手部的关键点信息，例如手指关节、掌心等。
定义目标坐标系：确定将手部姿态映射到哪个坐标系中，比如虚拟现实环境或者机器人坐标系。
姿态重定向：根据目标坐标系的需求，进行平移、旋转或缩放等变换。
首先将2D图像坐标转换为3D空间坐标，通常需要相机内参（焦距、主点位置等），根据关键点位置计算手部的姿态（位置、方向、旋转）；
然后可以使用旋转矩阵、四元数等方式表示手部的姿态；最后将手部的当前姿态转换到机器人的目标姿态。
输出重定向后的姿态：将重定向后的坐标记录用于后续处理。

二、简单实现手部姿态与机器人末端的重定向

MediaPipe检测器可以准确定位腕部框架中21个手指关节坐标的3D关键点和图像上的2D关键点。

代码示例

import cv2
import numpy as np
import pyrealsense2 as rs
import mediapipe as mp
import time

# 初始化 RealSense 管道
pipeline = rs.pipeline()
config = rs.config()
config.enable_stream(rs.stream.color, 640, 480, rs.format.bgr8, 30)
config.enable_stream(rs.stream.depth, 640, 480, rs.format.z16, 30)
pipeline.start(config)

# 初始化 MediaPipe 手部模块
mp_hands = mp.solutions.hands
hands = mp_hands.Hands(max_num_hands=2, min_detection_confidence=0.7)
mp_draw = mp.solutions.drawing_utils

# 机器人控制函数（示例），具体需要根据需要通过逆解解算
def move_robot_to(position):
    # 在这里添加机器人控制代码
    print(f"移动机器人末端到位置: {position}")

try:
    while True:
        # 获取图像帧
        frames = pipeline.wait_for_frames()
        color_frame = frames.get_color_frame()

        if not color_frame:
            continue

        # 转换为 numpy 数组
        color_image = np.asanyarray(color_frame.get_data())
        
        # 将图像转换为 RGB 格式
        rgb_image = cv2.cvtColor(color_image, cv2.COLOR_BGR2RGB)
        rgb_image.flags.writeable = False

        # 检测手部
        results = hands.process(rgb_image)

        # 将图像转换回 BGR 格式
        rgb_image.flags.writeable = True
        annotated_image = cv2.cvtColor(rgb_image, cv2.COLOR_RGB2BGR)

        # 如果检测到手部
        if results.multi_hand_landmarks:
            for hand_landmarks in results.multi_hand_landmarks:
                # 绘制手部标记
                mp_draw.draw_landmarks(annotated_image, hand_landmarks, mp_hands.HAND_CONNECTIONS)

                # 获取手腕的位置（关节0）
                wrist = hand_landmarks.landmark[mp_hands.HandLandmark.WRIST]
                h, w, c = annotated_image.shape
                wrist_x, wrist_y = int(wrist.x * w), int(wrist.y * h)

                # 将手腕位置转换为机器人坐标，需要进行不同坐标系的位姿变换
                robot_position = (wrist_x, wrist_y)
                move_robot_to(robot_position)  # 移动机器人末端

        # 显示结果
        cv2.imshow('Hand Detection', annotated_image)

        if cv2.waitKey(1) & 0xFF == ord('q'):
            break
finally:
    # 释放资源
    pipeline.stop()
    cv2.destroyAllWindows()

代码说明

初始化 RealSense 管道：设置相机流，并启动管道。
初始化 MediaPipe：配置手部检测模块。
实时捕获与处理：在循环中捕获视频帧，并检测手部姿态。
机器人控制：通过 move_robot_to 函数模拟移动机器人末端到手腕位置，需要根据自己的机器人接口实现具体的控制代码。
显示结果：在窗口中显示手部检测的图像，按 q 键退出。

运行代码

将代码保存为 hand_pose_robot.py。
连接 Intel RealSense D435 相机。
在终端中运行代码：
```
python hand_pose_robot.py
```

运行结果

在这里插入图片描述将 Intel RealSense D435 相机与 MediaPipe 的手部姿态检测整合在一起，可以实现手部姿态的实时检测，并将手腕的关键点转换为相机坐标系下的空间坐标。接下来，我们将编写一个完整的示例代码，进行手部关键点坐标到机器人坐标系的转换。

三、简单实现手腕与机器人末端的坐标转换

代码实现

以下是将 Intel RealSense D435 相机与 MediaPipe 手部姿态检测结合的完整代码示例：

import cv2
import mediapipe as mp
import numpy as np
import pyrealsense2 as rs

# 初始化MediaPipe手部模型
mp_hands = mp.solutions.hands
hands = mp_hands.Hands(static_image_mode=False, max_num_hands=1, min_detection_confidence=0.7)
mp_drawing = mp.solutions.drawing_utils

# 设置RealSense相机参数
pipeline = rs.pipeline()
config = rs.config()
config.enable_stream(rs.stream.depth, 640, 480, rs.format.z16, 30)
config.enable_stream(rs.stream.color, 640, 480, rs.format.bgr8, 30)

# 启动相机流
pipeline.start(config)

# 相机到机器人坐标系的转换矩阵（示例，需要根据实际情况调整）
camera_to_robot_transform = np.array([
    [1, 0, 0, 0],  # x轴
    [0, 1, 0, 0],  # y轴
    [0, 0, 1, 0],  # z轴
    [0, 0, 0, 1]   # 平移
])

def wrist_to_camera_coordinates(wrist_landmark, depth_frame):
    # 获取深度信息
    depth_value = depth_frame.get_distance(int(wrist_landmark.x * 640), int(wrist_landmark.y * 480))
    if depth_value == 0:
        return None  # 如果深度值为0，返回None

    # 计算空间坐标
    x = (wrist_landmark.x * 640 - 320) * depth_value / 525.0  # 525.0是相机焦距（可根据相机参数调整）
    y = (wrist_landmark.y * 480 - 240) * depth_value / 525.0
    z = depth_value

    return np.array([x, y, z])

def main():
    while True:
        # 获取相机帧
        frames = pipeline.wait_for_frames()
        color_frame = frames.get_color_frame()
        depth_frame = frames.get_depth_frame()

        if not color_frame or not depth_frame:
            continue
        
        # 转换为numpy数组
        frame = np.asanyarray(color_frame.get_data())

        # RGB转换
        frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        results = hands.process(frame_rgb)

        if results.multi_hand_landmarks:
            for hand_landmarks in results.multi_hand_landmarks:
                # 提取手腕关键点
                wrist_landmark = hand_landmarks.landmark[mp_hands.HandLandmark.WRIST]

                # 转换为相机坐标系下的空间坐标
                wrist_coordinates = wrist_to_camera_coordinates(wrist_landmark, depth_frame)

                if wrist_coordinates is not None:
                    # 映射到机器人坐标系
                    robot_coordinates = camera_to_robot_transform @ np.append(wrist_coordinates, 1)  # 同质坐标转换
                    
                    # 打印机器人坐标
                    print(f"Wrist Coordinates (Camera): {wrist_coordinates}")
                    print(f"Wrist Coordinates (Robot): {robot_coordinates[:3]}")  # 只取x, y, z

                # 可视化手部关键点
                mp_drawing.draw_landmarks(frame, hand_landmarks, mp_hands.HAND_CONNECTIONS)

        cv2.imshow('Hand Tracking', frame)
        
        if cv2.waitKey(1) & 0xFF == 27:  # 按Esc退出
            break

    # 停止相机流
    pipeline.stop()
    cv2.destroyAllWindows()

if __name__ == "__main__":
    main()

代码说明

RealSense 相机设置：使用 pyrealsense2 库来设置和启动 RealSense D435 相机的流。代码配置了颜色流和深度流。
MediaPipe 手部姿态检测：使用 MediaPipe 检测手部关键点，特别是手腕的位置。
手腕坐标转换：wrist_to_camera_coordinates 函数根据手腕的关键点和深度图计算相机坐标系下的空间坐标。
坐标转换：使用转换矩阵将相机坐标系下的手腕坐标转换到机器人坐标系。需要根据实际机器人和相机的位置关系调整 camera_to_robot_transform 矩阵。
可视化和输出：代码在每帧中显示检测到的手部关键点，并输出手腕在相机坐标系和机器人坐标系下的坐标。

运行代码

将代码保存为 hand_pose_robot.py。
连接 Intel RealSense D435 相机。
在终端中运行代码：

python hand_pose_robot.py

运行结果

Wrist Coordinates (Camera): [0.04378617 0.0835716  0.58400005]
Wrist Coordinates (Robot): [ 0.04378617 -0.0835716   0.58400005]

调整与测试

在实际应用中，可能需要：

根据 RealSense 相机的参数调整坐标转换公式。
调整机器人坐标系的转换矩阵，以匹配相机与机器人之间的实际位置关系。
增强代码的鲁棒性，处理深度数据的缺失情况。

四、总结

确保环境中已经安装了相关库，并且相机正常工作。运行后，窗口中将显示实时的手部检测结果，同时机器人末端会根据手腕位置进行重定向。可以实时监测手部动作并将其坐标转换为机器人坐标系，进而实现对机器人的控制。

原文地址：https://blog.csdn.net/weixin_40514381/article/details/142514732

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【相机】标准 GenICam 通用相机标准
下一篇：深入理解包管理工具

leetcode289:生命游戏
根据，简称为，是英国数学家约翰·何顿·康威在 1970 年发明的细胞自动机。给定一个包含m × n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为（live），或0即为
阅读更多2024-10-20
MongoDB数据恢复
注意：两个MongoDB的版本要一致，本文使用的是mongo:4.2.24。先把K8S上面的MongoDB 容器停止（可以把副本改成0）。1、将容器挂载MongoDB的数据目录备份到本地。经常是数据文
阅读更多2024-10-20
C#中实现事务
C#中实现事务
阅读更多2024-10-20
【LeetCode每日一题】——560.和为 K 的子数组
给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。
阅读更多2024-10-20
「漏洞复现」满客宝智慧食堂系统 selectUserByOrgId 未授权访问漏洞
请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任。工具来自网络，安全性自测，如有侵权请联系删除。本次
阅读更多2024-10-20
React面试题目（从基本到高级）
React前端面试常见题目涵盖了React的基础概念、组件、状态管理、生命周期、性能优化等多个方面。
阅读更多2024-10-20
12.个人博客系统（Java项目基于spring和vue）
1 在校学习的学生，可用于日常学习使用或是毕业设计使用 2 毕业一到两年的开发人员，用于锻炼自己的独立功能模块设计能力，增强代码编写能力。 3 亦可以部署为商化项目使用。 4 需要完整资料及源码
阅读更多2024-10-20
YoloV8改进策略：注意力改进|DeBiFormer，可变形双级路由注意力|引入DeBiLevelRoutingAttention注意力模块（全网首发）
本次改进的核心在于将DeBiLevelRoutingAttention模块嵌入到YoloV8的主干网络中，具体位置是在SPPF（Spatial Pyramid Pooling Fast）模块之后。这一
阅读更多2024-10-20
word取消自动单词首字母大写
情况说明：在word输入单词后首字母会自动变成大写取消单词首字母大写步骤：（1）点击菜单栏文件（2）点击“更多”——>“选项”（3）点击“校对”——>“自动更正选项”（4）取消“句首字母大
阅读更多2024-10-20
web前端网页用户注册页面
【代码】web前端网页用户注册页面。
阅读更多2024-10-20

基于RealSense D435相机实现手部姿态重定向

一、手部姿态重定向介绍

二、简单实现手部姿态与机器人末端的重定向

代码示例

代码说明

运行代码

运行结果

三、简单实现手腕与机器人末端的坐标转换

代码实现

代码说明

运行代码

运行结果

调整与测试

四、总结

相关文章