斯坦福大学为机器人操作模仿学习设计了示教新范式

🕗 发布于 2024-02-27 14:27 机器人学习 人工智能 模仿学习

近期斯坦福大学提出了通用操纵界面（UMI）–一种数据收集和策略学习框架，可将人类演示的技能直接转移到可部署的机器人策略中。

https://umi-gripper.github.io/

UMI 采用手持式抓手和精心的界面设计，可为具有挑战性的双臂和动态操纵演示提供便携式、低成本和信息丰富的数据收集。为促进可部署的策略学习，UMI 采用了精心设计的策略界面，具有推理时间延迟匹配和相对轨迹动作表示功能。学习到的策略与硬件无关，可在多个机器人平台上部署。有了这些功能，UMI 框架就能释放新的机器人操纵能力，只需改变每个任务的训练数据，就能实现零样本通用动态、双臂、精确和长序列行为。通过全面的真实世界实验证明了 UMI 的多功能性和有效性，在这些实验中，通过 UMI 零样本学习到的策略在不同的人类演示训练中可泛化到新的环境和物体。

硬件设计

如何才能仅凭一个安装在手腕上的摄像头就能为各种任务捕捉到足够的信息？UMI 的数据收集硬件采用了手持式平行钳夹的形式，并安装了 GoPro 摄像机①。为了收集可用于政策部署的观测数据，UMI 需要捕捉足够的视觉背景来推断动作②和深度③等关键信息。为了获取可部署策略的动作数据，UMI 需要捕捉人类快速运动下的精确机器人动作④、抓取宽度的微调⑤，并自动检查每个演示在特定的机器人运动学约束条件⑥下是否有效。

策略稳健性

UMI 采用独特的腕式摄像头设置和以摄像头为中心的动作表示法，100% 无需校准（即使在基础移动的情况下也能正常工作），并且能够抵御干扰因素和光线的剧烈变化。

能力测试

(1) 动态抛掷 🤾

机器人的任务是将 6 件物品扔到相应的垃圾箱中，并进行分类。3 个球形物体（棒球⚾、橙子ἴ、苹果🍎）应扔进圆形垃圾箱，而 3 个乐高 Duplo 碎片则扔进长方形垃圾箱。

(2) 杯子摆放 ☕

拿起一个意式咖啡杯并将其放在杯托上，杯柄朝向机器人左侧。UMI 收集的消融数据与机器人无关。在这里，可以在 UR5e 和 Franka 机器人上部署相同的策略。事实上，可以在任何配备平行钳行程大于 85 毫米的机器人上部署该策略。

(3) 双臂折叠衣物 👚

两个机械臂需要协调配合，将毛衣袖子向内折叠，然后将下摆向上折叠，旋转 90 度，最后再将毛衣对折。如果没有机械臂之间的本体感觉（两个机械臂之间的相对姿势），两个机械臂之间的协调就会大打折扣。

(4) 洗碗 🍽

为了成功洗碗，机器人需要依次执行 7 个相关动作：打开水龙头、抓住盘子、拿起海绵、清洗并擦拭盘子直到番茄酱被擦掉、放置盘子、放置海绵和关闭水龙头。使用 ResNet-34 作为视觉编码器训练的基线策略对盘子或海绵位置的变化没有反应。

户外泛化实验

有了 UMI，您可以到任何家庭、任何餐厅，在 2 分钟内开始数据收集。通过多样化的户外杯具操作数据集，UMI 使我们能够训练一种扩散策略，该策略可泛化到极度分散的对象和环境，甚至包括在饮水机顶部提供特浓咖啡杯！

原文地址：https://blog.csdn.net/weixin_44887311/article/details/136291832

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：axios封装
下一篇：ai智能电话语音机器人，ai外呼机器人怎么用

leetcode289:生命游戏
根据，简称为，是英国数学家约翰·何顿·康威在 1970 年发明的细胞自动机。给定一个包含m × n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为（live），或0即为
阅读更多2024-10-20
MongoDB数据恢复
注意：两个MongoDB的版本要一致，本文使用的是mongo:4.2.24。先把K8S上面的MongoDB 容器停止（可以把副本改成0）。1、将容器挂载MongoDB的数据目录备份到本地。经常是数据文
阅读更多2024-10-20
C#中实现事务
C#中实现事务
阅读更多2024-10-20
【LeetCode每日一题】——560.和为 K 的子数组
给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。
阅读更多2024-10-20
「漏洞复现」满客宝智慧食堂系统 selectUserByOrgId 未授权访问漏洞
请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任。工具来自网络，安全性自测，如有侵权请联系删除。本次
阅读更多2024-10-20
React面试题目（从基本到高级）
React前端面试常见题目涵盖了React的基础概念、组件、状态管理、生命周期、性能优化等多个方面。
阅读更多2024-10-20
12.个人博客系统（Java项目基于spring和vue）
1 在校学习的学生，可用于日常学习使用或是毕业设计使用 2 毕业一到两年的开发人员，用于锻炼自己的独立功能模块设计能力，增强代码编写能力。 3 亦可以部署为商化项目使用。 4 需要完整资料及源码
阅读更多2024-10-20
YoloV8改进策略：注意力改进|DeBiFormer，可变形双级路由注意力|引入DeBiLevelRoutingAttention注意力模块（全网首发）
本次改进的核心在于将DeBiLevelRoutingAttention模块嵌入到YoloV8的主干网络中，具体位置是在SPPF（Spatial Pyramid Pooling Fast）模块之后。这一
阅读更多2024-10-20
word取消自动单词首字母大写
情况说明：在word输入单词后首字母会自动变成大写取消单词首字母大写步骤：（1）点击菜单栏文件（2）点击“更多”——>“选项”（3）点击“校对”——>“自动更正选项”（4）取消“句首字母大
阅读更多2024-10-20
web前端网页用户注册页面
【代码】web前端网页用户注册页面。
阅读更多2024-10-20

斯坦福大学为机器人操作模仿学习设计了示教新范式

相关文章