自学内容网 自学内容网

模仿学习和强化学习的简单理解

模仿学习模仿学习(Imitation Learning)概述-CSDN博客

强化学习:​​​​​​强化学习入门这一篇就够了!!!万字长文-CSDN博客

详细概念可查看链接。

        无论是模仿学习还是强化学习,都是想让智能体,比方说机械臂学习一种策略(方法),可以完成相应的工作任务,比方说叠衣服。但两者有一些本质上的区别。

        模仿学习需要专家演示作为训练数据,以模仿学习常用的方法行为克隆为例,专家演示可以给出操作过程的状态(比方说,手部的位姿信息)和相应的动作(比方说此刻的位移,速度等),而行为克隆就是找到二者的对应关系,最终让机械臂可以做到,在一个人演示完如何叠衣服之后,机械臂也知道如何叠衣服。

        而对于强化学习,它也是要寻找状态和动作之间的对应关系,但它的状态和动作,并不像模仿学习一样是由人类演示,固定标准甚至最优的,强化学习强调从无到有的试错,模仿学习中,任何一个状态下对应的动作是固定的,而强化学习任何一个状态下在早期训练过程对应的动作都是不固定的,比方说训练模仿学习叠衣服,机器人就是要去叠衣服,整个过程心无旁骛,而强化学习,可能在这个过程,还会去探索拧螺丝,抓气球等,直到被反复敲打之后,才知道自己要做的是叠衣服。


原文地址:https://blog.csdn.net/weixin_48878618/article/details/140732505

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!