robomimic应用教程（一）——模型训练

🕗 发布于 2024-09-22 04:51 人工智能 机器人 python

Robomimic使用集中式配置系统来指定所有级别的(超)参数

本文介绍了配置（推荐）和启动训练运行的两种方法

一、使用config json（推荐）

二、在代码中构造一个配置对象

三、查看运行结果

1. 实验结果会存在一个固定文件夹中，可以设置存储位置：

2. 可以设置展示方式：

3. 可以设置存储方式：

4. 可以设置评估执行过程及视频存储：

5. 可以设置Tensorboard可视化：

6. 设置wandb可视化

一、使用config json（推荐）

指定训练参数的首选方法是通过--config参数将config json传递给主训练脚本train.py

数据集可以通过设置config json的train部分的data属性来指定，也可以通过--dataset参数来指定

下面的示例为BC算法运行一个默认模板json。这是开展训练的首选方式

python train.py --config ../exps/templates/bc.json --dataset ../../tests/assets/test_v141.hdf5

生成json配置以启动训练运行，可参考超参数助手教程

更多实战过程可参考Dexcap运行逻辑专题内容

二、在代码中构造一个配置对象

启动训练运行的另一种方法是创建默认配置，例如config = config_factory(algo_name="bc")

在python代码中修改配置，然后调用训练函数，就像在examples/train_bc_rnn.py脚本中一样。

import robomimic
import robomimic.utils.torch_utils as TorchUtils
from robomimic.config import config_factory
from robomimic.scripts.train import train

# make default BC config
config = config_factory(algo_name="bc")

# set config attributes here that you would like to update
config.experiment.name = "bc_rnn_example"
config.train.data = "/path/to/dataset.hdf5"
config.train.output_dir = "/path/to/desired/output_dir"
config.train.batch_size = 256
config.train.num_epochs = 500
config.algo.gmm.enabled = False

# get torch device
device = TorchUtils.get_torch_device(try_to_use_cuda=True)

# launch training run
train(config, device=device)

三、查看运行结果

使用第一种方法指定训练参数，就可以在config.json脚本文件中配置相关设置，定义及查看训练运行的结果

1. 实验结果会存在一个固定文件夹中，可以设置存储位置：

data

可以在<train.output_dir>/<experiment.name>/<date>实验目录文件夹下查看训练结果：

实验目录文件夹内部格式是固定的：

config.json               # config used for this experiment
logs/                     # experiment log files
  log.txt                    # terminal output
  tb/                        # tensorboard logs
  wandb/                     # wandb logs
videos/                   # videos of robot rollouts during training
models/                   # saved model checkpoints

2. 可以设置展示方式：

logging

"logging": {
    # save terminal outputs under `logs/log.txt` in experiment folder
    "terminal_output_to_txt": true,
    
    # save tensorboard logs under `logs/tb` in experiment folder
    "log_tb": true

    # save wandb logs under `logs/wandb` in experiment folder
    "log_wandb": true
},

3. 可以设置存储方式：

save

比如every_n_epochs定义了每多少轮存储一次

"save": {
    # enable saving model checkpoints
    "enabled": true,
    
    # controlling frequency of checkpoints
    "every_n_seconds": null,
    "every_n_epochs": 50,
    "epochs": [],
    
    # saving the best checkpoints
    "on_best_validation": false,
    "on_best_rollout_return": false,
    "on_best_rollout_success_rate": true
},

4. 可以设置评估执行过程及视频存储：

rollout

"rollout": {
    "enabled": true,              # enable evaluation rollouts
    "n": 50,                      # number of rollouts per evaluation
    "horizon": 400,               # number of timesteps per rollout
    "rate": 50,                   # frequency of evaluation (in epochs)
    "terminate_on_success": true  # terminating rollouts upon task success
}

视频存储配置模块：

render_video

要存储视频，则设置为true

5. 可以设置Tensorboard可视化：

在实验目录文件夹中、打开终端、激活环境、并输入：

tensorboard --logdir logs --bind_all

实验结果（y轴）是根据epochs（x轴）记录的。关键的日志指标包括：

Rollout/：评估的任务成功率、奖励等，Rollout/Success_Rate/{envname}-max：最大成功率随时间变化

Timing_Stats/：算法执行加载、训练和回滚等操作所消耗的时间

Train/：训练数据

Validation/：验证数据

System/RAM Usage (MB)：系统内存使用情况

6. 设置wandb可视化

此外，可以通过wandb查看结果，类似于tensorboard（UMI中使用的wandb），需配置log_wandb为True

首次登录wandb，需要登录账号（自己提前注册）

在robomimic/macros_private.py中将WANDB_ENTITY设置为wandb账户名

Note：如果该文件不存在，运行python robomimic/scripts/setup_macros.py来设置private macros file

默认情况下，所有结果将记录在名为default的wandb项目下

可以通过设置配置文件中的wandb_proj_name更改

原文地址：https://blog.csdn.net/qq_28912651/article/details/142353778

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：基于Pytorch框架的深度学习MODNet网络精细人像分割系统源码
下一篇：MySQL表的增删改查

获取IPV6地址的参考网站|nginx解析IPV6|linux服务器获取IPV6的方法
【代码】获取IPV6地址的参考网站|nginx解析IPV6|linux服务器获取IPV6的方法。
阅读更多2024-09-22
Java项目实战II基于Java+Spring Boot+MySQL的车辆管理系统（开发文档+源码+数据库）
"随着汽车行业的蓬勃发展，车辆管理已成为企业和个人日常生活中不可或缺的一部分。为了提高车辆管理的效率与准确性，我们设计并开发了一款基于Java+Spring Boot+MySQL的车辆管理系
阅读更多2024-09-22
一些面试问题
或者使用HTTP2协议，也可以很好的减少报文的体积，提高传输效率。HTTP：如果是基于HTTP1.1的协议，请求中会包含很多无用的内容，如果是基于HTTP2.0，那么简单的封装以下是可以作为一个RPC
阅读更多2024-09-22
hutool 解压缩读取源文件和压缩文件大小失败导致报错
最近处理老项目中的问题，升级安全jar，发现hutool的jar在解压缩的时候报错了，实际上是很简单的防御zip炸弹攻击的手段，但是却因为hutool的工具包取文件大小有bug，造成了解压缩不能用，报
阅读更多2024-09-22
如何安装部署kafka
安装和部署需要以下几个步骤，包括下载 Kafka、配置 ZooKeeper（或者使用 Kafka 自带的 Kafka Raft 模式替代 ZooKeeper），以及启动 Kafka 服务。以下是一个但
阅读更多2024-09-22
【C++】模拟实现list
本篇内容到这里就结束了，主要模拟实现了list容器的常用接口，希望对大家有些许帮助，祝大家天天开心！
阅读更多2024-09-22
【数据结构&&C语言】【入门】【首次万字详细解析】入门阶段数据结构可能用到的C语言知识，一章让你看懂数据结构！！！！！！！
数组的定义其实非常非常简单；他就是是一组相同类型的集合不理解也没关系，我给你举个例子就好了。数组的定义：数组是一组相同类型的集合给你讲个故事：我认识一个朋友（纯属虚构），她是一个事业心非常强的人，无论
阅读更多2024-09-22
JVM面试题-说一下JVM主要组成部分及其作用
栈和程序计数器的运行是线程私有的内存区域，运行时数据区域就是我们常说的JVM的内存。总体来说，方法区和堆是所有线程共享的内存区域；
阅读更多2024-09-22
MiniAuth - 轻量级.Net开源身份认证中间件
【代码】MiniAuth - 轻量级.Net开源身份认证中间件。
阅读更多2024-09-22
数字资产与数据资产的区别
数据资产是企业或个人拥有的具有经济价值的数据资源，形式多样。面临的数据资产风险挑战包括数据保障风险、数据质量问题、数据隐私保护及数据管理成本高。数字资产是以数字形式存在、具有经济价值和可交易性的资产，
阅读更多2024-09-22

robomimic应用教程（一）——模型训练

一、使用config json（推荐）

二、在代码中构造一个配置对象

三、查看运行结果

1. 实验结果会存在一个固定文件夹中，可以设置存储位置：

2. 可以设置展示方式：

3. 可以设置存储方式：

4. 可以设置评估执行过程及视频存储：

5. 可以设置Tensorboard可视化：

6. 设置wandb可视化

相关文章