特斯拉正用纯视觉数据训练 Optimus,让机器人真正用 " 眼睛 " 理解世界。
据 Business Insider 最新报道,特斯拉已将人形机器人 Optimus 的训练方式从动作捕捉转向纯摄像头数据采集,数十名数据采集员工在实验室内重复执行日常动作,为机器人学习人类行为提供视频训练素材。

马斯克在第三季度财报电话会议上称 Optimus" 有潜力成为有史以来最大的产品 ",并预计该公司最终将每年生产 100 万台机器人。他还表示,Optimus 有一天可能占到这家汽车制造商价值的 80% 左右。
训练方式全面转向摄像头数据采集
特斯拉工程总部的一个玻璃实验室内,数据采集工人们执行着看似简单但极其精确的重复动作。每个动作都要在 8 小时轮班期间重复数百次,所有行为都被头盔上的五个摄像头和背包设备完整记录。
今年 6 月,在项目总监 Milan Kovac 离职后,公司告知员工将从动作捕捉服装和远程操作转向仅使用摄像头收集数据。工人表示,团队被告知这种方式能够更快地扩展数据收集规模。
除了工人身上的摄像头设备,特斯拉还在工作区域周围设置了固定摄像头。谢菲尔德大学机器人专家 Jonathan Aitken 表示,这些固定摄像头塔能够提供更广阔的环境视角,补充身上摄像头的数据。
工人们有时还配备触觉手套,用于追踪手部的细微动作。马斯克曾表示,特斯拉在为 Optimus 开发类人手部方面投入了大量精力,称其为 " 极其困难的工程挑战 "。
AI 生成任务指令覆盖复杂动作场景
特斯拉已开始使用 AI 生成的提示来帮助训练机器人。在某些训练练习中,工人通过连接到背包的头戴设备接收一系列 AI 生成的指令,需要在 3-5 秒内完成每个动作。
据工人描述,这些练习包括下蹲、做 " 鸡舞 "、模仿大猩猩、假装吸尘、短距离冲刺、假装打高尔夫球等动作。一些任务甚至包括婴儿智力游戏,如按大小和颜色套环,或将形状放入相应的槽中。
两名数据采集员提到,有些 AI 生成的任务让他们感到不适,包括四肢爬行或脱掉衣服的要求。不过专家认为,这些看似随机的任务可能帮助特斯拉了解需要改进的领域。
在弗里蒙特工厂,数据采集员还会在佩戴头盔和背包的情况下整理车辆零件,在传送带上工作。专家表示,为同一任务收集不同的数据点对训练很有帮助。
机器人实际表现仍面临技术挑战
尽管在公司视频中,Optimus 能够行走、叠衣服、表演功夫动作并在时代广场分发糖果,但实际训练中的表现差距明显。

Aitken 表示,在特斯拉办公室这样的受控环境中,机器人应该能够轻松保持直立。" 让它站起来并保持平衡应该是你首先要解决的问题之一。"
俄勒冈州立大学 AI 和机器人专家 Alan Fern 指出,机器人演示 " 总是他们能向你展示的最好演示 "。当看到它表演功夫时,虽然看起来在做智能的事情,但 " 它只是对环境做出反应,背后没有认知思考 "。
