主要内容
人形机器人阿特拉斯以其跑酷和舞蹈动作而闻名,最近开始展示一些更微妙但也更重要的东西:它学会了使用单个人工智能模型行走和抓取物体。
更重要的是,机器人的单个学习模型展示了一些诱人的“涌现”技能,例如在没有经过训练的情况下本能地恢复掉落物品的能力。制造阿特拉斯的波士顿动力公司与丰田研究所(TRI)一起开发了一个通用模型,该模型从一系列示例动作中学习控制双臂和双腿。这与常规不同:配备学习能力的机器人通常依赖一个模型行走和跳跃,另一个模型抓取物体。
“从某种意义上说,脚就像模型的额外手,”丰田研究所和麻省理工学院的机器人学家 Russ Tedrake 说,他领导了当前的工作。“而且它起作用了,这非常棒。”
用于控制阿特拉斯的单个模型接收来自机器人视觉传感器的图像、身体传感器的本体感受数据(为其提供位置和运动的连续感)以及与不同动作相关的语言提示。该模型展示了阿特拉斯使用远程操作、模拟和演示视频的混合来执行一系列任务的示例。由此产生的大型行为模型(LBM)以更自然的方式控制人形机器人。例如,在从箱子中挑选物品时,机器人会像人一样重新定位其腿部,以在伸手低处时重新平衡。
LBM 还表现出一些基本的涌现行为。例如,当机器人掉落物品时,它会通过弯腰捡起它来展示一种新的“恢复”技能。这比看起来要令人兴奋得多。就像由大量文本数据喂养的大型语言模型(LLM)有时会表现出意想不到的能力,如编码能力一样,机器人学家希望类似的策略在尝试完成任务时能让机器人展现出许多令人惊讶的新技能。
Tedrake 表示,阿特拉斯和其他机器人开始显示出更广泛学习的迹象。他的实验室还在试验不同类型的机器人手臂,这些手臂经过训练可以执行各种任务,包括切蔬菜和清扫洒出的咖啡豆。虽然还有很多工作要做,但 Tedrake 表示,到目前为止的所有证据都表明,用于 LLM 的方法也适用于机器人。
当然,随着视频剪辑显示商业人形机器人轻松执行复杂家务,如装载冰箱或倒垃圾,评估机器人技术的进展变得更加具有挑战性。然而,YouTube 剪辑可能具有欺骗性,人形机器人往往要么是远程操作的,要么是提前精心编程的,要么是在非常受控的条件下训练来执行单一任务的。新的阿特拉斯工作是一个重要迹象,表明机器人开始在机器人技术领域经历类似的进步,最终导致了在生成式 AI 领域给我们带来 ChatGPT 的通用语言模型。最终,这种进步可能会让我们的机器人能够在各种混乱的环境中轻松操作,并能够快速学习新技能——从焊接管道到制作浓缩咖啡——而无需大量的再培训。
“这绝对是向前迈出的一步,”加州大学伯克利分校的机器人学家 Ken Goldberg 说,他从 TRI 获得了一些资金,但未参与阿特拉斯的工作。“腿部和手臂的协调是一件大事。”然而,Goldberg 表示,应该谨慎对待涌现机器人行为的想法。就像大型语言模型的令人惊讶的能力有时可以追溯到其训练数据中的示例一样,他说机器人可能会展示出看似比实际更新颖的技能。