文 | 划重点 KeyPoints
划重点:
1、为期三天的首届世界人形机器人运动会出现了不少搞笑名场面,究其原因是当前机器人缺乏对环境感知和自身控制的能力。
2、在受控环境中,机器人已经能自主完成感知—决策—执行的完整闭环;并且具身智能正在从 " 单一任务 " 走向 " 多任务泛化 "。
3、要让机器人真正具备与人类比肩的环境适应力和任务执行力,仍需在动态平衡与姿态控制技术、低延迟环境感知与决策系统、高能效续航技术、多任务泛化学习能力,以及低成本高可靠性硬件方案等方面继续发力。
为期整整三天,世界第一场机器人运动会,可谓是受到了全球人类的围观。
因为当我们碳基生命以为会是一场科技感十足、未来感满满的技术盛宴时,硅基生命们却超级反差地呈现出了大型搞笑现场。
最最最经典的名场面,莫过于宇树机器人的 " 肇事逃逸 " 事件了:
这种违反阿西莫夫的机器人原则第一条(不得对人类造成伤害)的事件,一下子在外网火了起来。
不过网友们讨论的另一个点,就是为什么非得用遥控器才行。关于这个问题,具体原因主要有两方面。
一方面是机器人自身的稳定性问题,本质上源于动态平衡。跑步是一种极易失衡的运动形式,机器人必须在极短时间内完成姿态调整。
然而,现有的传感器、算法和执行器在反应速度和精度上仍然不足,难以在复杂地形中保持稳定。这时,人工遥控可以在机器人即将失衡时及时介入。
比如,宇树的另一款机器人 G1 在今年 4 月被第三方用于参加半程马拉松时,就曾出现摔倒的情况。
另一方面是环境感知能力的不足。虽然传感器能够获取周围信息,但在高速奔跑状态下,数据往往存在延迟或精度不够,导致机器人无法像人类一样迅速作出判断。人工遥控正好可以弥补这种感知与决策上的短板。
这次机器人在短暂脱离遥控后就发生了撞人事故,也从侧面印证了上述问题。
但在这场运动会另外的赛事中,乌龙和搞笑名场面也是不断在上演。
例如在拳击比赛中,趁着工作人员不注意,绕到他的身后,直接开始挥拳了:
但你以为世界人形机器人运动会就是来搞笑的吗?非也非也,在各大赛事中,也有不少机器人给出了非常惊艳的表现。
而它们,或许正是代表了目前国产机器人的最高水平。
01 宇树 H1 机器人:拿下田径 1500 米首金
同样是那位肇事逃逸的宇树 H1 机器人,非常反差的一个表现,就是它拿下了这届 1500 米田径赛的首金,共计耗时 6 分 34 秒。
宇树 H1 的这一成绩,换算下来相当于长跑运动中的 " 四分配速 ",即每公里耗时约 4 分 22 秒。
这是一个什么概念?作为参照,中国国家二级运动员的男子 1500 米标准是 4 分 10 秒。这意味着,H1 的速度已经超越了许多经过长期训练的业余跑者,甚至接近了专业运动员的门槛。
这一成就之所以令人瞩目,不仅在于其绝对速度,更在于其背后所展现的技术进步。仅仅在几个月前,机器人在马拉松赛事中的表现还步履蹒跚,被戏称为 " 老奶奶步伐 "。
而今,宇树 H1 却实现了从 " 站不稳 " 到 " 快成残影 " 的惊人蜕变,这背后是硬件与算法协同进化的必然结果。
宇树 H1 之所以能够取得如此突破性的表现,其核心在于两大支柱的协同作用:坚实的硬件基础和革命性的 AI 算法。
为了支撑高强度的奔跑运动,H1 在硬件层面进行了全面的优化与升级:
· 高爆发力矩电机:机器人奔跑时,关节需要瞬间输出巨大的力量。H1 配备了自研的高性能电机,其峰值扭矩高达 360 牛 · 米,同时具备出色的力矩 - 速度曲线和高效的散热能力,确保在持续高强度运动中不会因过热而降频或损坏。
· 高强度轻量化结构:奔跑时,足底与地面会产生剧烈的冲击力。H1 的机身结构采用了高强度合金与碳纤维等轻量化材料,在保证结构刚性的同时,最大限度地减轻了自身重量,从而降低了运动能耗和关节负荷。
· 高功率电池系统:持续的高速奔跑对能源供应提出了极高的要求。H1 搭载了大功率电池组,能够提供稳定且持久的高电压输出,为电机和控制系统提供充足的 " 弹药 "。
相比之下,同期参赛的其他一些机器人在基础的平衡控制上仍存在巨大挑战,出现了 " 下楼梯摔得头掉,跑步两米就原地打转 " 的窘况。
如果说硬件为 H1 提供了强健的 " 体魄 ",那么先进的 AI 算法则赋予了它智慧的 " 灵魂 "。
近年来,机器人行业正普遍从传统的 ZMP(零力矩点)等控制方法,转向以深度强化学习(Deep Reinforcement Learning, DRL)为代表的 "Learning" 技术路线。
· 深度强化学习(DRL):通过这种算法,机器人可以在虚拟环境中进行数百万次的 " 试错 " 训练。它不再依赖于工程师编写的复杂运动规则,而是像人类学习走路和跑步一样,自主探索并优化步态、平衡和运动策略。在训练中,算法会根据预设的奖励函数(例如,速度最快、能耗最低、姿态最稳)对机器人的行为进行打分,从而引导其学习到更高效、更稳定的运动模式。
· 具身智能(Embodied AI):这种学习方式的成果,就是让 H1 展现出了所谓的 " 具身智能 "。它不再是僵硬地执行预设指令,而是在奔跑中表现出 " 丝滑、连贯的自适应平衡能力 "。无论是微小的地面起伏还是自身姿态的动态变化,它都能实时调整步态和重心,保持身体的稳定。这种高度的自适应能力,使其动作完整度和流畅度远超同类产品,奠定了其在运动能力上 " 一骑绝尘 " 的领先地位。
然而,在为 " 四分配速 " 这一成就惊叹的同时,我们更应看到其背后所暴露出的能量效率、结构强度、环境适应性等深层次的制约因素。
这场关于速度的竞赛,其终点并非简单地超越某个人类运动员的记录,而是要让机器人能够真正安全、可靠、高效地走进现实世界,在复杂的环境中完成多样化的任务。
02 天工机器人:100 米夺冠
宇树机器人无疑是本届人形机器人运动会最大的亮点,但除了它之外,其它机器人也给出了不俗的表现。
例如来自北京人形机器人创新中心的天工,便拿下 100 米的冠军:
从近期披露的技术细节来看,我们可以把它背后的技术亮点归结为四点:
1. 具身世界模型体系:这一体系包括拥有物理时空理解与推理能力的 72B 多模态大模型,以及驱动神经网络的世界模拟器,帮助机器人更好地理解现实、预测环境变化,相当于它的 " 中枢大脑 "。
2. 跨本体 VLA(视觉 - 语言 - 动作)模型:让机器人能够在不同场景和任务间自由切换,通过一个模型即可调用多种技能,极大降低了应用开发的时间和成本。
3. 全身控制自主导航系统:提供点对点导航、动态障碍感知与避障能力,这是机器人在实际工作中必不可少的核心能力。
4. 千台机器人真实场景数据采集计划:通过让机器人深入工厂、物流、酒店等真实场景运行,持续收集大规模数据,为算法迭代和模型优化提供 " 燃料 "。
在感知能力方面,天工机器人搭载了强大的视觉传感系统,每秒可处理高达 550 万亿次运算,并配合高精度惯性测量单元(IMU)和 3D 视觉传感器。
与传统的 2D 视觉相比,3D 视觉能更精准识别缺陷、提升检测速度,在自动化生产和环境感知中更具优势。
除了视觉感知,天工机器人还装备了六维力传感器。这种传感器能够全面捕捉机器人在手腕、脚踝等关键部位的受力情况,从而实现柔顺控制和精准操作。
总体来看,天工机器人背后的技术突破,不仅让其在赛场上展现了全自主奔跑的实力,更代表着人形机器人在感知、决策与执行层面正逐步走向成熟,推动具身智能从实验室迈向实际应用场景。
03 星动 L7:跳高跳出新纪录
在跳高赛事中,最亮眼的就当属清华系具身智能企业星动纪元的星动 L7 了。它以 95.641cm 高度,不仅打破纪录,更是断崖式领先取得第一名的成绩。
例如在硬件方面,要求机器人的关节具备极高的瞬时扭矩输出和结构强度,以克服自身重力并产生足够的腾空动力。
在动态控制方面,还涉及复杂的多物理场耦合问题,机器人必须在毫秒之间实时优化质心轨迹、调控角动量,并精准控制落地姿态,这对控制算法和传感器精度构成了严峻挑战。
而身高 171cm、体重 65kg 的星动 L7,其核心动力源于自研的高性能关节模组。该模组的峰值扭矩高达 400N · m,峰值转速达到 25rad/s,为机器人提供了媲美人类运动员的爆发力。
它全身集成的 55 个准直驱 " 活动关节 " 协同工作,确保了力量的精准传导和动作的高度灵活性。
无论是完成跳高所需的瞬间发力,还是此前展示的 360 度旋转跳、高速奔跑(最高时速 4m/s)和复杂街舞动作,都彰显了其硬件设计的卓越性能与可靠性。
如果说顶级硬件构筑了 L7 的身体素质基础,那么其先进的 " 大脑 " ——端到端强化学习能力,则是其夺冠的关键。
面对仅有几天的备战时间,研发团队依托自研的端到端强化学习平台,在虚拟环境中进行了数百万次模拟训练。通过将人类跳跃的动作数据作为奖励信号,L7 的算法模型快速迭代,自主学会了最优的起跳角度与空中姿态协同策略。
这一快速学习能力的背后,是星动纪元自主研发的端到端 VLA(视觉 - 语言 - 动作)具身大模型 ERA-42。该模型不仅支撑了 L7 在运动场上的卓越表现,更在仓储物流等复杂场景中展现了强大的泛化能力。
无论是面对堆叠无序的货物进行智能分拣,还是精准定位并扫描包裹条码,ERA-42 都能驱动 L7 快速适应并高效完成任务。
星动 L7 此次夺冠,是星动纪元 " 算法 + 硬件 " 全栈自研技术路线的有力证明。从电机、减速器到驱动器的硬件全链条自研,到融合视觉感知、语言理解与动作规划的具身大模型,软硬件的深度协同,共同铸就了 L7 的巅峰表现。
04 智元远征 A2:群舞《秦俑魂》夺冠
除了传统的竞技之外,这次的运动会还开设了一个别开生面的赛事——群舞比拼。
毕竟机器人跳舞这事,这几年也是一直爆火。而拿下这个赛事冠军的机器人本体,正是来自智元的远征 A2。
为了契合舞蹈的高难度需求,智元团队对机器人进行了硬件与软件的全面优化。电机、关节、驱动等关键部件均经过重新设计,以承受旋转、腾跃等舞蹈动作带来的冲击;在算法层面,采用先进的运动规划与仿真技术,实现了动作轨迹、速度与力度的精确控制,使机器人能够精准卡点音乐节奏,动作既自然流畅又充满力量感。
更为突出的是,智元机器人展现出优秀的群体协同能力。通过传感器与算法结合,机器人能够实时感知周边环境并微调动作,避免舞台碰撞,实现九机同步的整齐走位。
这一能力不仅是舞蹈表演成功的关键,更为物流仓储、服务导览等实际场景提供了可靠借鉴。机器人在复杂环境中灵活穿梭、避障与协调的表现,显示了智元在运动控制与感知交互上的深厚技术积累。
当然,人形机器人产业仍面临成本高昂、续航不足等挑战。但智元通过技术创新,已经为未来的规模化应用提供了范例。
05 具身智能,现在到了什么水平?
从这次机器人运动会的表现可以看出,具身智能正处在一个快速突破的阶段。虽然机器人们在赛场上仍不断上演 " 笑场名场面 ",但整体水平相比过去已有了质的飞跃。从技术和产业角度来看,可以从以下几个方面来理解当下的进展。
过去,人形机器人常常连 " 站稳 " 都是难题,如今像宇树 H1 已经能够在 1500 米长跑中跑出接近人类运动员的成绩。这背后体现了高功率电机、轻量化结构和强化学习算法的协同进化。机器人在高速运动中保持动态平衡的能力,标志着运动控制已进入实用阶段。
天工机器人在赛场上实现了完全自主导航,这在几年前几乎难以想象。这依赖于多模态感知系统、全身控制导航和具身世界模型的结合。虽然离真正媲美人类的环境理解还有差距,但在受控环境中,机器人已经能自主完成感知—决策—执行的完整闭环。
星动 L7 的跳高成绩展示了端到端强化学习在复杂运动中的潜力。通过在虚拟环境中进行数百万次仿真,机器人可以快速掌握高难度动作。再结合视觉 - 语言 - 动作(VLA)大模型,机器人不仅能完成运动任务,还能适应多样化的现实场景,如物流、仓储等。这表明具身智能正在从 " 单一任务 " 走向 " 多任务泛化 "。
目前的机器人依然面临能耗高、可靠性不足、适应复杂非结构化环境的挑战。但从技术路线来看,软硬件一体化自研、多模态大模型驱动,以及大规模真实世界数据采集,正在加速推动机器人走向产业化。无论是工厂、物流还是服务业,具身智能的应用窗口正在打开。
尽管机器人在速度和爆发力等单项能力上开始逼近甚至超越普通人类,但在灵活性、稳定性、环境理解和能效方面仍远不及人类。这意味着,未来的发展方向不仅是 " 跑得更快、跳得更高 ",更是 " 更安全、更节能、更聪明 ",真正实现人机协作。
总体而言,具身智能正处于 " 从炫技到实用 " 的关键转折点。机器人已经能够在一些特定场景中展现接近人类的运动能力,但距离真正大规模走入日常生活,还有一段技术和应用上的长坡厚雪。
除此之外,有人将人形机器人的快速迭代解读为 " 技术泡沫 ",认为当下的热闹不过是资本与流量催生的短期狂欢。但从这场机器人运动会的细节来看,这种判断显然失之偏颇。
宇树、天工、星动、智元,背后是高功率电机、深度强化学习、多模态感知等技术的实质性突破,而非停留在概念层面的 " 炫技 "。这些进步正在将 " 人形机器人走进现实 " 从科幻推向可触摸的产业蓝图,因此绝非泡沫。
但不可否认的是,要让机器人真正具备与人类比肩的环境适应力和任务执行力,仍需在动态平衡与姿态控制技术、低延迟环境感知与决策系统、高能效续航技术、多任务泛化学习能力,以及低成本高可靠性硬件方案等方面继续发力。