速递|Figure优先打造家务机器人,接受语音指令承接任务

图片来源:Figure

Figure 创始人兼CEO, Brett Adcock 周四公布了一种用于人形机器人的新型机器学习模型。两周前 Adcock 宣布湾区机器人公司决定退出 OpenAI 合作,该消息围绕 Helix 展开,Helix 是一种“通用”视觉-语言-动作 (VLA) 模型。

VLA 是机器人领域的一个新现象,利用视觉和语言命令来处理信息。目前,该类别中最著名的例子是Google DeepMind 的 RT-2,它通过视频和大型语言模型 (LLM) 的组合来训练机器人。

图片来源:Figure

Helix 的工作方式类似,它将视觉数据和语言提示结合起来,实时控制机器人。Figure 写道:“Helix 表现出强大的物体泛化能力,只需用自然语言询问,就能捡起数千种形状、大小、颜色和材料特性各异的新奇家居用品,而这些物品在训练中是从未见过的。”

你只需告诉机器人做某事,它就会去做。据 Figure 称,这就是 Helix 的作用所在。该平台旨在弥合视觉和语言处理之间的差距。在收到自然语言语音提示后,机器人会通过视觉评估其环境,然后执行任务。

Figure 提供了一些示例,例如“将一袋饼干递给你右边的机器人”或“从你左边的机器人那里接过一袋饼干,并将其放在打开的抽屉里”。

这两个示例都涉及一对机器人的协同工作。这是因为 Helix 的设计目的是同时控制两个机器人,其中一个机器人协助另一个机器人执行各种家务。

Figure 展示了 VLM,重点介绍了该公司在家庭环境中使用 02 人形机器人所做的工作。众所周知,房屋对于机器人来说是棘手的,因为它们缺乏仓库和工厂的结构和一致性。

学习和控制困难是复杂机器人系统进入家庭的主要障碍。这些问题以及五到六位数的价格标签是大多数人形机器人公司不优先考虑家用机器人的原因。

一般来说,这种方法是为工业客户制造机器人,在解决住宅问题之前,先提高可靠性并降低成本。家务活是几年后人们谈论的话题。

2024 年, TechCrunch参观了 Figure 位于湾区的办公室,Adcock 展示了这款机器人在家庭环境中的一些测试步骤。当时,这项工作似乎并没有得到优先考虑,因为 Figure 专注于与宝马等公司合作进行工作场所试点。

随着周四 Helix 的公告,Figure 明确表示家庭本身应该成为优先事项。对于测试此类训练模型来说,这是一个具有挑战性和复杂性的环境。例如,教机器人在厨房里做复杂的任务,可以让它们在不同环境中进行广泛的操作。

图片来源:Figure

Figure 表示:“要让机器人在家庭中发挥作用,它们需要能够根据需求产生智能的新行为,尤其是针对它们从未见过的物体。目前,教会机器人哪怕是一种新行为也需要大量的人力:要么是数小时的博士级专家手动编程,要么是数千次演示。”

手动编程不适用于家庭,未知数实在太多。厨房、客厅和浴室各不相同。烹饪和清洁所用的工具也各不相同。此外,人们会留下杂物,重新布置家具,并且喜欢各种不同的环境照明。这种方法花费太多时间和金钱——尽管 Figure肯定有很多后者。

另一种选择是训练——而且要进行大量的训练。在实验室中训练机器人手臂拾取和放置物体通常使用这种方法。你看不到的是,需要数百小时的重复训练才能使演示足够强大,能够承担高度可变的任务。要想第一次就正确地拾取某样东西,机器人需要在过去进行数百次这样的训练。

就像目前围绕人形机器人的很多研究一样,Helix 的研发工作仍处于非常早期的阶段。观众应该知道,幕后还有很多工作要做,才能制作出本文中展示的那种简短、制作精良的视频。今天的公告本质上是一种招聘工具,旨在吸引更多工程师加入,帮助项目发展。

参考资料:
https://techcrunch.com/2025/02/20/figures-humanoid-robot-takes-voice-orders-to-help-around-the-house/

——-

(文:Z Potentials)

发表评论