商汤科技联合创始人、大晓机器人董事长王晓刚,于 2025 年 12 月 18 日在大晓机器人发布会上,首次系统提出 " 以人为中心(Human-Centric)" 的具身智能数据采集理念,核心是通过记录人类自然行为来高效训练机器人,颠覆传统 " 以机器为中心 " 的遥控采集模式。
一、提出背景:行业数据困境
传统具身智能(机器人)数据采集采用 **" 以机器为中心 "** 的 " 特种兵模式 ":
方式:专业人员佩戴 VR 设备、操纵杆,远程遥控昂贵机器人(单台数十万)重复动作。
效率极低:全行业数年累计数据仅约10 万小时,远未达 AI " 涌现 " 门槛。
成本高昂:设备、人力、时间成本巨大。
泛化性差:数据与特定硬件强绑定,A 机械臂模型无法用于 B 机械臂。
脱离真实:数据非来自人类真实生活场景,机器人难理解物理规律与意图。
二、" 以人为中心 " 核心:ACE 范式与环境式采集
王晓刚提出ACE(Environment Capture, World Model, Embodied Model)范式,其核心是环境式数据采集:
核心理念:让人适应工作,而非适应机器。在自然环境中,无感捕捉人类与世界的真实交互。
穿戴设备:人员佩戴轻便第一视角(眼镜)、力触觉传感器。
环境感知:配合第三视角摄像头、麦克风等多模态设备。
数据维度:融合视觉、语音、力触觉、运动轨迹、物理规律等全要素数据。
效率飞跃:千人团队日均可采集1 万小时数据,年目标千万小时级。
成本剧降:无需昂贵机器人,普通工人即可在工作中同步采集。
通用泛化:数据源于人类行为,与硬件无关,实现 "一脑多行"。
物理理解:数据自带物理因果,让机器人掌握 " 思维链 ",懂力度、意图。
三、技术支撑:开悟世界模型 3.0
配合数据采集,商汤发布开悟世界模型 3.0:
价值放大:将真实数据通过仿真合成,效果等效上亿小时数据规模。
物理引擎:内置物理规律,让机器人在虚拟中预演、试错,理解物体属性。
3D 资产库:构建 " 人 — 物 — 场 " 精准虚拟世界,支撑模型训练。

路线革命:从 " 教机器做 " 变为 " 学人类做 "。
规模突破:解决数据瓶颈,为人形机器人的 "ChatGPT 时刻 " 铺路。
商业化加速:降低门槛,推动机器人在仓储、零售、安防等场景快速落地。