人形机器人一直是人类历史中占据特殊地位的存在。
从引发争议的「辩论高手」索菲亚到波士顿动力的后空翻机器人,从斯皮尔伯格《人工智能》中的「人类之子」到《机械公敌》里的「觉醒者」,无论现实或者科幻,对于外形酷似人类但不同于人类的机械产物,人类抱有非常丰富又复杂的情感。
或许是人类社会复杂性使然。当技术高速推进并极有可能创造出这样的未来时空时,这些智能新物种到底会如何和人类相处?它们究竟将为人类带来什么?当问题越发深入,人就越容易产生不计其数的联想,而这些联想也无形中影响着整个人类社会。
在将至未至却又近在咫尺的未来,基于人工智能的机器人仿佛就在那扇门前和我们招手,而作为被好奇心驱使的生物,人类总能通过科技去寻找真正的答案。在 CES 2019 的现场,我们得以看到一些可能的答案,而回答者正是一台真正的人形机器人。
从轮式到仿人的跨越
当身高 1.45 米的人形机器人 Walker 在展区内像人一样四处走动,亲切而又自然的与人进行交互时,不仅仅是我,周围的老外也露出惊讶的目光。这个拥有身体和四肢,依靠头部摄像头感知周围环境的机器人可以轻易的在地毯、地板、大理石等不同材质地面的稳定行走,如果对面有人,它会打招呼或者聊上两句,如果有人轻轻推它,它身体会晃动一下调整姿态,就好像有人不小心撞了你一下那样。
「它现在才 3 岁。」优必选 CTO 熊友军和团队正在展台旁展示 Walker 新一代,作为工程师他已经不是第一次来到拉斯维加斯的 CES。但和去年那个还只有两条腿没有胳膊的 Walker 第一代 机器人不同,今年的 Walker 变成了一个真正的人形机器人,优必选的机器人团队用了三年时间,就把 Walker 进化成了现在这副模样。
实际上,研发大型仿人机器人的难度之大,在行业内早有共识。不论是日本从上世纪 80 年代开始研发的 ASIMO 机器人,还是上世纪 90 年代建立公司的美国波士顿动力,都是这一领域深耕十多年的老手,但直到今天它们仍然距离我们生活很遥远,就在于成本原因迟迟无法量产。
相较而言,优必选在 Walker 机器人身上只用了三年时间就做成如今这个能走会抬手,可以在家里自由移动和人交流的样子,而由于采用自主研发的伺服舵机、运动控制算法、机器视觉等技术,过去高昂的成本终于得以降低,这正是优必选走进家庭的秘密武器。而在熊友军看来,Walker 机器人之所以如此快速地成长起来,在于优必选选择了一条属于自己的独特道路。
「外观上你可能觉得只是加了胳膊,加了头,但实际上 Walker 有非常多的升级。」熊友军告诉极客公园,在一年时间里,Walker 机器人内部从硬件部分、算法部分和人工智能部分都有了巨大变化。
「首先是在硬件上,对 Walker 第一代的伺服舵机进行了升级。去年 Walker 只有腿的时候重量比较轻,今年增加的双臂和头部让重量增加了很多,这对于舵机的要求更多了。实际上它在舵机的扭矩、功率、驱动方式等方面都有了变化。」
伺服舵机是优必选机器人的核心技术之一,为了让机器人的关节能够动起来,全世界机器人公司都在尝试寻找行之有效的方法。本田 ASIMO 机器人使用的是电机伺服,波士顿动力采用的是液压技术,但受限于成本目前很难实现量产,商业化之路漫长。
「我们一直以来都在这方面进行深度研究,优必选的 Walker 第一代是双足机器人,现在我们在双足上加上了身体和双臂,全身具有 36 个高性能伺服关节。该伺服关节是一体化驱动单元,由无框力矩电机、精密谐波减速、驱动控制器及双编码器组成。在此基础上,Walker 实现了平稳快速的行走和灵活精准的操作,使 Walker 新一代具备了在常用家庭场景和办公场景的自由活动和服务能力,让机器人真正走进我们的生活又向前迈进了一大步。」熊友军这样解释道。
有了伺服舵机还需要好的算法,就像运动员有了肌肉也需要掌握运动规律,Walker 新一代在算法上的调整是伴随整体改变而变化的。「这一次 Walker 加了很多力传感器和运动传感器,为了使 Walker 走起来更快更稳定,同时要适应外部环境的变化,算法部分也要进行很多调整。Walker 在力觉反馈系统和柔性控制上有了很大提升,所以你能看到它能拿起桌子上的可乐而不捏碎它,实际上它需要明白可乐需要用多大的力度拿取。」
熊友军告诉极客公园,在加了手臂之后, Walker 机器人面对的难题比以前更复杂也更多。由于要做到用手臂配合手掌作出各种动作。它也会涉及到「手眼协调」等技术。而优必选期望打造出一个能给人开门,帮人从冰箱拿可乐,可以端茶倒水的家庭服务机器人,所以对 Walker 新一代机器人在视觉、听觉、空间知觉上都进行了升级。这是一台结合了诸多人工智能技术的产物,也很可能进入未来人类家庭进行服务。
当人形机器人走进家庭
从 2008 年开始,优必选开始研发伺服舵机,在大扭矩、小体积高精确度方面进行尝试,经过了消费级人形机器人 Alpha 系列、STEM 教育智能编程机器人 Jimu Robot 的尝试,终于积累出属于不同于其他机器人公司的独特路线。
从 C 端开始,2016 年登上春晚的 Alpha(此后继续扩展的 Alpha 系列如今的成员众多),2017 年联合迪士尼推出的第一军团冲锋队员机器人,2018 年推出的悟空机器人,这些 C 端机器人的成功为 B 端积累了大量经验。
智能服务机器人 Cruzr(克鲁泽)则是优必选在 B 端的重要探索。2018 年 1 月 6 日,2150 台 Cruzr(克鲁泽)机器人在居然之家上岗工作,它们在商场进行引导、提供智能服务,也是有史以来人工智能机器人第一次尝试大规模进入线下新零售的案例,最近 Cruzr(克鲁泽)进入 Accor 雅高旗下巴西酒店以及泰国手机零售商 Jaymart,在 B 端新零售领域找到了新方向。
Walker 机器人项目从 2015 年开始。优必选在 2016 年与清华大学成立了智能服务机器人联合实验室,并邀请了清华大学赵明国教授担任「人形机器人首席科学家」,同时还聘请了 IEEE Fellow、欧洲科学院外籍院士陶大程博士担任「人工智能首席科学家」,技术团队的不断强化,使得技术可以快速迭代更新。三年时间,Walker 机器人实现了快速成长。
「公司现在有一千多人,研发团队差不多占据一半左右。很难说具体有多少人具体参与了 Walker 的研发,这其中包括运动控制、智能舵机、语音交互、U-SLAM 导航、智能视觉等各方面,涉及到的基础领域很广,所以参与研发的人员非常多。」
Walker 机器人是面向家庭服务场景开发的机器人,同时也可以应用于智慧康养、商业服务和科研开发等领域。之所以将其定位为家庭服务场景,是因为让机器人进入家庭,成为家庭重要的一员,是优必选从未改变过的目标。Walker 新一代是优必选为实现这一目标迈出的坚实一步。Walker 新一代的应用,包含两个重要平台,一是机器人操作系统 ROSA,另一个是云服务系统。而这两个平台相互结合,让 Walker 可以在家庭场景下发挥非常多的作用。
以此次重点展示的抓取物体的能力为例,虽然端茶倒水、从冰箱拿起一罐可乐这样的事情在我们看来平淡无奇,都是任何正常人能轻松完成的事情,但对机器人的来说却有着极大挑战,也是 Walker 未来进入家庭场景需要克服的技术难点,熊友军详细介绍了其中的难度。
「比如机器人关节的柔顺控制,因为要在家庭环境的场景中工作,所以它不能对人造成伤害,人碰到机器人时也需要它能有比较柔软的动作。这和工业流水线上的机器人的固定的程式化动作是不一样的。Walker 需要在开门、开冰箱、拿可乐的时候,有一个力的控制,而不至于把苹果捏碎,或者把门把手弄坏。」
不仅仅是端茶递水,伴随着算法的更新迭代,Walker 将能够持续性进化,学会越来越多的事情来为家庭服务。另外,每当 Walker 机器人要运动时,它的手臂并不同于工厂中的机械臂那样固定不变,而且是根据外部信息实时规划的,这在算法上是一个难点。「在家庭场景中抓取物品,搬运或者推拉,这些都需要实现对环境的判断、识别,也要对包括物体的位置、姿态等进行识别,里面有很多工作要做。」
Walker 机器人面向家庭场景的另一项能力在于 IoT 设备联动。在 2017 年针对海外推出的 Lynx 智能机器人上,优必选就已经搭载了亚马逊 Alexa 语音助手,因此具备了联动控制智能家庭设备的能力。随着 5G 时代到来,家庭设备的联动将越来越密切,Walker 机器人也会成为家庭控制的中心,而这一点在过去的人形机器人身上也很少见到。
看得见的智能机器人未来
在见到这样一个能四处行走,可以拿可乐、开门、端茶倒水的机器人表演后,现场不少媒体对 Walker 新一代机器人的成本和售价产生了好奇。不过熊友军告诉我们,现阶段 Walker 距离正式量产还有一段距离,但他期待的是「Walker 能以一台中级轿车的价格先走进一部分家庭,或者先在一些特殊场景发挥作用」,并且一步步走进普通家庭。
「现在它做的是一些简单的事情,比如端茶倒水,从冰箱里拿东西,还有陪伴老人、小孩,最终我们希望它能成为一个智能管家。」目前来说,Walker 已有的功能也许还不一定可以完全胜任家庭管家的角色,熊友军认为 Walker 新一代具备了在常用家庭场景和办公场景的自由活动和服务能力,让机器人真正走进我们的生活又向前迈进了一大步。「当然,现在的 Walker 机器人还处在服务机器人的早期阶段,能做的事情都还是有限的,它的运动能力,它跟人交互的能力这些还需要完善。」
熊友军认为,人形机器人一定会成为未来家庭场景中非常重要的角色,他说:「真正能融入家庭的一定是人形机器人,而不是现在的智能音箱或者轮式机器人,大家情感上能接受的一定是和我们比较相像的,是能被我们广泛认同的机器人。」实际上,这种情感上的认同正是我们对于人形机器人一直以来保持不断探索的深层原因,和智能音箱或者轮式机器人不同,机器人和人进行交互时最重要的不仅在于理性智能,更在于感性处理。
「我们在做的就是让它能根据不同的对象来有针对性的交互,针对性的服务,这是我们考虑的地方。未来机器人更多的应该是情感交互,人形机器人是情感交互的很好的载体。」所以优必选同样在 Walker 的机器视觉系统上下了很多功夫。
「它有视觉交互系统,所以能判断人的状态是什么样,家里谁是爷爷奶奶,谁是爸爸妈妈哥哥姐姐,根据不同的人它会有不同的模式,可能对于小孩和大人,它的交互模式是不一样的,交互情感也会不同。通过人脸识别和情感识别,它能去识别你是高兴还是沮丧,所以针对这些情绪能主动进行一些交互,你不高兴可能会给你唱歌或者讲笑话,或者给你拿点好吃的过来。如果看到老人可能会陪伴一起聊天或者来播放一些戏剧之类的内容。
在优必选看来,有了情感识别的能力,机器人或许就不再仅仅是人们的工具,它能成为更好的伙伴一样的存在。也许现阶段,这些技术的商业化还需要时间,但它们将来一定会进入人们家庭当中。「硬件的成长成熟需要过程,商业化需要时间。优必选希望能引领走入家庭的这一过程,推动这个过程,所以我们希望把这件事做成。」在看得见的机器人未来世界,Walker 机器人的每一步对于整个行业来说都是很有意义的,我们也应该给它更多时间,就像采访最后熊友军所说:
「我们希望大家能把它当成一个小孩,三岁的小孩还需要成长和学习的过程。」