关于ZAKER 合作
量子位 2小时前

机器人全程自主收拾客厅!390 亿美元估值机器人端到端新技能,英伟达持续加注

估值高达 390 亿美元、英伟达持续看好的 Figure,刚刚放出了最新进展,引来大量网友围观。

这次,其机器人能够完全自主、端到端全流程整理客厅了。

只见它先是喷洒消毒液擦拭了茶几(毛巾撩到肩膀头子好好笑):

接着将茶几和沙发上的杂物拾起,归置到了收纳桶中:

随后又把抱枕一一摆正:

最后,它甚至拿起遥控器,精准按下了关机键,还强迫症似的把遥控器也摆摆好:

网友看完这一套行云流水的操作,纷纷让团队赶快安排现场直播演示。

还有网友认为,难的并不是让机器人移动物体,而在于让它理解你喜欢的是什么样子。

值得一提的是,背后支撑这一突破的,正是 Figure 团队自主研发的具身大脑 Helix 02。

就在一个月前,搭载该系统的 Figure 03 机器人,已在家庭厨房场景中完成了从洗碗机取盘到放入橱柜的整套自主操作。

近 4 分钟,机器人全程没有重置、无人为干预、也没有遥操作,将行走、抓取、搬运、放置等 61 个操作一气呵成:

据了解,此次解锁客厅整理新任务,团队并未新增算法,也未进行特殊场景的工程适配,仅通过补充最新场景数据,便让 Helix 02 系统成功掌握了这一复杂日常任务。

仅补充新数据,Helix 02 就能掌握全新任务

Helix 02 于一个多月前发布。它是一套单神经网络系统,能够直接通过像素控制全身,支撑机器人在整间屋子内完成灵活且长周期的自主任务。

具体来说,Helix 02 打造了一个统一的视觉—运动神经网络——

一个统一全身行走—操作的一体化 VLA 模型(A Unified Whole-Body Loco-Manipulation VLA)。

它把机载的全部传感器、视觉、触觉与本体感知直接接到所有执行器上,让机器人把 " 感觉、思考、行动 " 当成一件事来做。

实现这一点的关键,在于 Figure 在去年 2 月发布的 Helix 双(快慢)系统架构基础上,引入了一个新的 System 0,用于全身控制。

至此,Helix 02 形成了一套从像素到扭矩(torque)的紧密层级系统:

System 2:慢系统,负责高层语义推理——理解场景、理解语言,并将任务拆解为一系列行为目标。

System 1:快系统,以 200 Hz 的频率进行快速思考,将感知结果转化为全身关节目标。

System 0:以 1kHz 的频率执行,负责平衡、接触处理以及全身协调执行。

System 0 是一个学习得到的全身控制器:它基于 1000 多小时的人类运动数据训练,并结合了仿真到现实(sim-to-real)的强化学习。

System 0 用一个神经网络先验,替代了 109504 行手工编写的 C++ 控制代码,负责把每一个动作执行得稳定、自然且可控。

从定位上看,System 0 是一个面向人形机器人的全身控制基础模型,不为某一个具体动作服务。它学习的也不是 " 如何走路 " 或 " 如何伸手 ",而是一种更底层的先验:人在保持平衡与稳定的前提下,通常是怎么运动的。

这也是 Helix 02 的物理具身核心所在——

当上层系统在规划 " 做什么 " 时,System 0 负责保证 " 身体能不能顺利、稳定地把这件事做出来 "。

与传统做法中为行走、转向、下蹲、伸手分别设计奖励函数不同,System 0 直接从大规模、多样化的人类运动数据中,学习对人类动作的整体跟踪能力。

在复现这些动作的过程中,策略自然学会了如何在各种行为之间协调受力、调整姿态并维持平衡,从而覆盖通用行走—操作所需的完整能力范围。

如果说 System 0 解决的是 " 全身动作执行的时候保持稳定 ",那 System 1 解决的就是:所有感知信息,如何变成可执行的全身动作。

Helix 02 中,System 1 接入了全部传感器,并直接控制整台机器人:

输入:头部摄像头、手掌摄像头、指尖触觉传感器,以及全身本体感知。

输出:覆盖双腿、躯干、头部、手臂、手腕与每一根手指的完整关节级控制。

这种从像素到全身(pixels-to-whole-body)的架构,使 System 1 能够将机器人自身状态与环境视为一个强耦合的整体系统来进行推理。

最后,System 2 承担语义推理,负责处理场景、理解语言,并为 System 1 生成语义级的隐式目标。

目前,仅需补充新数据,Helix 02 就能掌握需要融合移动能力、操作灵活性与环境感知能力的全新任务。

总结本次全新演示,Helix 02 在房间内自如行走的同时,持续完成对各类物品、工具及容器的精准操控。团队强调,他们未研发新算法、未开展特殊场景定制化开发,系统就已习得了以下技能:

协同使用工具清洁表面:先用喷壶湿润脏污表面,再用毛巾用力擦拭,清除污渍。

动态操控柔性物品:灵活应对毛巾的复杂形态变化,将毛巾从手臂上取下、调整毛巾角度以适配清洁需求、把毛巾甩搭至肩头以腾出双手。

完成复杂双手协同操作:双手端起收纳盒并保持稳定,同时将桌上积木舀入盒中。

采用全身协作策略提升效率:将收纳盒夹在腋下,腾出双手捡拾玩具。

精准完成物体抛接动作:以快速可控的动作将枕头抛回沙发。

手内调整物体姿态以执行精细任务:拿起遥控器后,在手中调整其朝向,精准按下关机键关闭电视。

移动过程中调整工具存放方式:在切换任务的间隙,将毛巾暂时夹在腋下。

精准控步穿行狭窄空间:侧身穿过茶几与沙发之间的狭小缝隙,同时不间断进行物品操控。

最后团队还表示,随着可执行任务的不断增加,Helix 02 的技能库持续扩充,将逐步迈向一套人形机器人系统,就能完成家庭与办公场景下的各类日常任务。

Figure:估值 390 亿美元、英伟达持续看好

Helix 02、Figure 机器人背后团队 Figure。量子位之前也有介绍过,成立于 2022 年 5 月。创始人 Bret Adcock 是位连续创业者,曾创办一家电动飞机上市公司。

2024 年 3 月,Figure 初代机器人 Figure 01 正式发布,同期与 OpenAI 达成合作。

时隔仅 5 个月,第二代产品 Figure 02 亮相。依托与 OpenAI 的合作,这款机器人搭载了定制训练的 AI 模型,配备麦克风与扬声器模块,可实现与人类的语音交互功能。

不过合作并未持续太久,去年 2 月,Figure 突然宣布与 OpenAI 解约。据 Techcrunch 报道,双方合作破裂的核心原因,在于 AI 模型与机器人硬件的集成环节出现分歧。

即便与 OpenAI 分道扬镳,Figure 的发展势头依旧迅猛。

这家公司自创立之初就备受科技巨头青睐,OpenAI、微软、英伟达等企业均曾对其押注。去年 9 月,Figure 完成 C 轮融资,斩获超 10 亿美元承诺资本,投后估值一举攀升至 390 亿美元,创下目前公开信息里具身智能赛道的最高估值纪录。

C 轮融资由 Parkway Venture Capital 领投,英伟达继续加注,Brookfield Asset Management、麦格理资本、英特尔资本、Align Ventures、Tamarack Global、LG Technology Ventures、Salesforce、T-Mobile Ventures、高通风投等也都有参与。

参考链接:

[ 1 ] https://x.com/Figure_robot/status/2031038981333565949

[ 2 ] https://www.figure.ai/news/helix-02-living-room-tidy

欢迎 AI 产品从业者共建

「AI 产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库,旨在成为 AI 行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。

一键关注 点亮星标

科技前沿进展每日见

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容