教机器人如何走路已经不新鲜了,如果教机器人摔倒后如何站起来呢?近日,苏黎世联邦理工学院(ETH Zurich)的研究人员在人工智能(AI)的帮助下,完成了这项不简单的任务。
在Arxiv.org一篇新发表的论文“使用深度强化学习的四足动物机器人的强健恢复控制器”中,他们描述了帮助机器人在绊倒和摔倒后从地上爬起来的人工智能系统。
研究人员在报告中写道:“在摔倒的情况下,动物表现出从任何姿势中恢复过来的非凡能力,它们可以通过挤压周围环境和摆动四肢来获得动力。在有腿的机器人中拥有类似的能力,将显著提高它们对失败的稳健性,并扩大它们在恶劣环境中的适用性。我们在目前的工作中,通过开发一个四足机器人的稳健恢复机动控制策略来解决这个问题。”
他们的模型采用了一种名为深度强化学习的人工智能训练技术,该技术使用一种奖励机制来驱使探员朝着特定的目标前进,并控制机器人的恢复动作。通过四种神经网络策略,即研究人员在模拟环境中分别对它们进行了训练,再将它们部署在一个名叫ANYmal,有四条腿,如小狗一般大小,并且拥有12个自由度的机器人上。
控制器组件根据最近的观察、命令、先前选择的行为类型和先前的动作等因素,为机器人的给定情况选择三种行为之一——移动、站立或自扶正,另外一个模块则是高度估计器,测量了它的基础高度,以防止机器人偏离轨道。
研究人员说,人工智能驱动的策略消除了手工制定恢复规则和序列的需要,相对于许多流行的控制方案具有优势。此外,结果被证明是非常欣喜的,因为它们能够处理不可预知的情况,比如机器人的腿卡在底部以下。
初步结果令人鼓舞,在机器人开始躺下的50次测试中,自我纠正策略在5秒内成功恢复。此外,即使机器人的底座几乎是倒立的,腿被卡在下面的时候,它也能成功,有时它会在尝试站立之前,指令机器人侧翻。
在第二项实验中,研究人员在任何动物行走或站立时踢它,这项政策成功恢复了47次,只有当机械四足动物的关节位置异常高时才会失败。研究人员承认,该系统只在平地上训练和测试过,这意味着它在面对陡峭的斜坡或崎岖的地形时很可能会失败。但在未来的工作中,他们计划通过随机模拟环境来解决这一限制。