与OpenAI官宣合作13天后,Figure旗下人形机器人的性能突飞猛进。
近日,Figure AI释出的一段视频显示,人形机器人Figure 01可以识别眼前物体,回答开放性提问,并听从指令将黑色塑料袋收拾进框子里、将杯子和盘子归置放在沥水架上。
GXT3-3000RT230 Figure创始人兼首席执行官Brett Adcock强调,视频中Figure 01展示了端到端神经网络框架下与人类的对话,不存在任何远程操控。同时机器人的速度有了显著提升,开始接近人类的速度。
能识别、能对话、能思考
“Figure 01,你现在看到了什么?”
“我看到桌中间有个红苹果,一个沥水篮、一些杯子和盘子,以及你站在旁边,手搭在桌子上。”
既能识别出静态物体,还能判断人类的动作,Figure 01的视觉识别和理解能力可见一斑。
在随后的多轮对话里,Figure 01继续展现了其在上下文回溯、推理、GXT3-3000RT230 多任务处理等方面的能力。
当被问到桌上有什么可以食用的,Figure 01回答:“当然”,随后流畅地把红苹果递给了提问者。
随后提问者往桌上倒了几个黑色塑料袋,要求Figure 01一边解释刚刚为何递给他苹果,一边把桌上垃圾收起来。Figure 01随后迅速给出反应,双手一边将塑料袋放回垃圾筐里,一边回答道:“我刚刚给了你个苹果,因为这是桌上唯一能吃的东西。”
紧接着,提问者给出了开放式提问,要求Figure 01结合面前的场景,GXT3-3000RT230 判断应该把盘子放在哪。Figure 01表示,杯子和盘子可能该放在沥水篮里,并根据指令将杯子和盘子放进了沥水篮。
在问答中,Figure 01也显露了其在上下文推理上的能力。当提问者问道:“你能把它们放到那儿去吗(Can you put them there)?”,没有明示把何种物体放到何处,Figure 01根据前后文准确判断出代词所指代的含义,并完成相应指令。
Figure 01最后对上述表现进行了自我评估:“我觉得我做得很好,苹果找到了新主人,垃圾被扔掉了,餐具也放到了该放的地方。”