机器人能够对物理定律拥有直觉理解,听起来可能像艾萨克·阿西莫夫的小说情节。不过,谷歌机器人部门的科学家却透露,他们已经打造出这样的机器人。目前,即使是最有能力的机器人,也很难完成投掷、滑动、旋转、摆动、接球和其他运动技能,但是这些科学家表示,他们的研究工作将为未来的机器人系统奠定基础。
谷歌学生研究员Andy Zeng在一篇博客文章中写道:“尽管机器人在高效抓取物体、视觉自适应甚至从现实世界经验中进行学习等方面已经取得了相当大的进步,但机器人操作仍然需要仔细考虑如何拾取、处理和放置各种物体——尤其是在非结构化的环境中。但是,机器人能不能学会有利地使用动力学,培养物理‘直觉’,从而让它们更有效地完成任务?”
为了回答这个问题,Zeng和同事们与普林斯顿、哥伦比亚和麻省理工学院的研究人员合作,开发了一种他们称之为TossingBot的拾取机器人,该机器人可以学会抓取物体并将其扔进“自然范围”之外的盒子里。它不仅达到了之前最先进模型的两倍速度,而且实现了两倍的有效放置范围,并可以通过自我监督进行改善。
要想实现具有可预测性的投掷并不容易,即使对人类来说也是如此。抓力、姿势、质量、空气阻力、摩擦力、空气动力学和无数其他变量都会影响物体的轨迹。通过反复试验来模拟射弹物理是有可能的,但Zeng指出,这将耗费大量的计算资源,需要大量的时间,而且不会生成一般普遍的规律。
相反,TossingBot使用射弹弹道模型来估计物体到达目标位置所需的速度,而且它使用端到端的神经网络——以生物神经元为模型的数学函数层——根据来自头顶摄像机的视觉和深度数据进行训练,以此来预测基于估计值的调整度。Zeng说,这种混合方法使系统能够达到85%的投掷准确度。
教会TossingBot抓取物体有点棘手。首先,它需要反复尝试“不好的”抓取,直到找到更好的方法,同时通过以前所未有的速度随机投掷物体来提高投掷能力。经过大约14小时、1万次抓取和投掷尝试后,TossingBot可以在大约87%的时间里牢牢抓取放置在杂乱堆积物品中的物体。
或许更令人印象深刻的是,经过一两个小时的训练,TossingBot可以适应从未见过的地点和物品,比如假水果、装饰物品和办公用品。Zeng说:“TossingBot很可能学会更多地依赖几何线索(如形状)来学习抓取和投掷。这些新出现的特性都是自我学习,除了任务级的抓取和投掷之外,没有任何明确的监督。然而,它们似乎足以使系统区分对象类别(如乒乓球和记号笔)。”
研究人员承认,由于TossingBot使用严格的视觉数据作为输入,如果对易碎物体进行测试,可能会妨碍它在测试中对新物体做出反应的能力。但是他们也表示,结合物理学和深度学习,将会是未来一个有希望的方向。