关于ZAKER 合作
钛媒体 1小时前

魏哲家演讲背后的冷思考:人形机器人的胜负手正被重新定义

文 | 孙永杰

近日,一句看似 " 刺耳 " 的判断,让人形机器人赛道颇受震动。魏哲家公开表示,那些 " 能跳来跳去 " 的机器人 " 没用,好看而已 "。之所以引发巨大争议,不只是因为这与公众认知相悖,更因为说这话的人是掌控全球算力命脉的台积电掌门人。而当一个站在产业链顶端的人开始否定最 " 热闹 " 的部分,往往意味着真正胜负手的关键已经发生了转移。

从 " 会动 " 到 " 有用 ",被误解的人形机器人进化路径

众所周知,过去两年人形机器人最吸引眼球的能力,几乎都集中在高动态动作上。无论是 Tesla 的 Optimus,还是中国厂商频繁展示的翻跟头、跑酷、舞蹈,这些极具视觉冲击力的表现,都很容易让人产生一种直觉判断,那就是既然人形机器人能完成如此复杂的动作,那它一定已经很智能。

但误解恰恰在此。人类倾向于用 " 看得见的动作复杂度 " 来推断 " 看不见的智能水平 ",而忽略了这两者在机器人领域并不等价,甚至经常错位。例如人形机器人完成后空翻,本质上是一个在高度可控环境中,通过工程手段反复优化的结果,即依赖的是电机、减速器、传感器以及控制算法的精密配合,是典型的机械工程与控制理论的胜利,而非真正意义上的 " 理解世界 "。而这种认知偏差,正好对应经典的莫拉维克悖论,那就是对人类而言简单的感知与操作,对机器却异常困难。

基于此,真正的挑战,并不在于让人形机器人完成一个标准动作,而是让它进入真实世界。例如在厨房里拿起一个鸡蛋,这里物品摆放随时变化,光线与遮挡不确定,鸡蛋的脆弱程度无法量化,甚至突发干扰(比如宠物)都需要即时应对,这种情形下,单纯依赖预先写死的控制代码已远远不够。机器人需要通过摄像头、麦克风、力矩传感器和温度传感器等多模态感知硬件采集大量非结构化数据,将其送入大模型进行理解和推理,再在毫秒级内输出决策。而这正是当前所谓 " 具身智能 "(Embodied AI)和 " 物理 AI"(Physical AI)领域竞争的核心,即如何让具身智能体在真实世界中实现类似人类的灵活应对,也正是在这里," 身体 " 和 " 大脑 " 开始彻底分化,即驱动关节运转的,是伺服电机、减速器和运动控制(相当于 " 小脑 ");而理解场景、规划动作、与人互动的,则是运行在芯片上的大模型(真正的 " 大脑 ")。

不可否认,中国凭借强大的制造业体系,在机器人 " 身体 " 层面已经建立起极高的效率与成本优势。

据市场研究机构 Omdia《通用具身智能机器人 2026》报告最新统计,2025 年全球人形机器人出货量已经超过 1.3 万台至 1.45 万台,较前一年实现数倍增长,而其中近 90% 来自中国厂商,例如宇树、智元、优必选以及新锐 AgiBot 等。短短几年,中国凭借电机、减速器、电池等完整供应链,把人形机器人的硬件成本迅速压低到全球最低,部分入门型号价格甚至低于 6000 美元。

但就如上述,真正决定机器人是否 " 有用 " 的,是它的 " 大脑 ",而这则是另一条完全不同的竞争赛道。

算力与制程,人形机器人竞争真正的胜负手

如上述,当人形机器人从 " 会动 " 转向 " 有用 ",一个更底层的现实浮出水面,即人形机器人的核心,不在关节和电机,而在芯片。

众所周知,2026 年,AI 芯片市场的爆发在汽车等消费领域已经产生连锁反应,具体表现为存储芯片和算力芯片供不应求,DDR5 等关键存储价格大幅上涨,部分供应商甚至预告二季度价格涨幅可能达到 40% 以上。为此大量传统车企上调售价,背后一个重要原因正是其自动驾驶与智能座舱所需的算力和存储资源,被 AI 工业和机器人算力需求从同一池子里 " 抽走 " 了产能。

与此同时,英伟达在 GTC 2026 推出面向具身智能的新一代计算平台,试图把 " 机器人大脑 " 的训练、验证和部署做成一整套闭环系统,即云端有专为具身智能优化的世界模型和训练框架,中间有 Omniverse/Isaac Sim 这样的高保真仿真环境,边缘端则是持续升级的 Jetson/Orin 乃至 Jetson Thor 等机器人 SoC。而对于机器人厂商来说,一旦选定了这条技术路径,则不止芯片,而是把整个软件栈、开发工具链乃至后续运维都绑定在了英伟达身上。

此外,AMD、谷歌、亚马逊以及微软等云巨头也在不断推出自研 AI 加速器。例如微软 1 月刚刚发布的 Maia 200 推理加速器同样采用台积电 3 纳米制程,配备 216GB HBM3e 内存;亚马逊 Trainium3、谷歌第 7 代 TPU Ironwood 均已量产或试产,试图在这一赛道分一杯羹。

而它们的共同特点是计算和功耗密度极高,对制程和封装的要求远超传统手机 SoC 或通用 CPU。而要想在 30 – 60 瓦甚至更低的功耗下支撑百亿参数级多模态模型的实时推理,且具备一定的冗余空间,应对算法迭代,这些芯片几乎都必须压在 5 纳米、4 纳米甚至 3 纳米制程节点,并与多堆叠 HBM 通过 2.5D/3D 先进封装方式紧密耦合。这几乎将所有路径,收敛到同一个终点—先进制程能力。

也正因为如此,无论是谁设计芯片,最终都要 " 排队 " 交给台积电等少数代工厂生产,这构成了魏哲家敢于宣称 " 全球 95% 的机器人大脑由台积电制造 " 的底气。虽然这一比例在统计口径上可能存在争议,但业界普遍认为,在 5 纳米、3 纳米等先进制程以及 CoWoS 等 2.5D/3D 先进封装领域,台积电目前的确拥有压倒性优势,甚至连英伟达自家高层都公开承认,其旗舰 GPU 交付能力很大程度上被台积电封装产能 " 天花板 " 限制。

从这个意义上说,中国企业在机器人 " 身体 " 环节拿下 80% – 90% 甚至更多的出货份额,并不等于掌握了产业链的话语权。

不可否认,在电机、减速器、结构件、电池等部件上,中国凭借完善的供应链和极致的成本控制,的确做到了全球最强,但在决定性能上限和利润率高低的 AI 芯片设计、制程及软件栈环节等核心方面仍牢牢掌握在美国设计巨头和台积电这样的代工寡头手中。而这一剪刀差,也正是魏哲家站在台上,敢于对 " 会跳来跳去的机器人 " 嗤之以鼻的底层逻辑所在,即真正决定人形机器人竞争格局的,不是谁先造出下一个会后空翻的钢铁侠,而是谁拥有为它们 " 装上大脑 " 的制程与算力。

分化中竞未来,美中路径殊途同归

如果我们把上述视为一场围绕 " 算力高地 " 的全球布局,那么在中国,则正在进行一场极其艰难却异常关键的 " 换脑术 "。

众所周知,在美国对高端 GPU 和相关 EDA 工具、制造设备等实施多轮出口限制后,中国企业在获取顶级英伟达 GPU(如 H100、H200、B200 等)方面面临严格约束,尤其是在大型训练、推理集群以及高端机器人控制平台上,越来越难以直接采购最新产品。

在这种压力下,华为的昇腾(Ascend)系列成为中国本土算力基础设施的代表,其正在通过大规模集群架构(如基于 910C/910D 的 AI 集群)、自研 AI 框架 MindSpore 以及配套的软件生态,试图构建一套相对完整的国产算力体系。

与此同时,中国在 " 机器人大脑 " 侧的探索,并非只是昇腾这一条主线。

一方面,以地平线、黑芝麻智能为代表的边缘 AI 芯片厂商,正在将原本服务于自动驾驶的高能效推理芯片向机器人场景延伸,强调在低功耗条件下完成视觉感知与实时决策,这类芯片虽然算力规模不及数据中心级 GPU,但在实际落地中更接近 " 机器人控制中枢 " 的形态;另一方面,寒武纪、燧原科技等通用 AI 芯片厂商,则继续在训练与推理一体化方向推进,试图在数据中心侧提供可替代 GPU 的算力底座,与昇腾形成某种 " 多点支撑 " 的格局。

此外,一些整机厂商也开始自研或深度定制机器人专用 SoC,例如围绕运动控制、传感融合与多模态推理进行异构集成,试图在通用 GPU 之外,走出一条更贴近机器人形态的专用计算路径。

需要强调的是,虽然国内厂商在 " 小脑 "(运动控制)和 " 眼睛 "(视觉识别)芯片上已经能做到性价比极高,但真正的痛点依然在于缺乏类似英伟达 Jetson Thor 那样的 " 超大规模多模态通用计算平台 ",使得目前国内大部分厂商依然处于 " 拼盘 " 阶段,例如用华为或地平线的芯片做视觉感知,用国产高性能单片机做电机控制,再用自研算法进行粘合。而这种 " 拼盘 " 式的做法,势必导致软件适配的 " 木桶效应 "、算力损耗与通信延迟以及 " 数据飞轮 " 断层等挑战。

以 " 数据飞轮 " 的断层为例,由于国产厂商往往缺乏配套的高保真仿真平台,如果用英伟达的平台训练,再手动把模型 " 翻译 " 到国产芯片上,中间的精度损失和适配工作量极其惊人。又如软件适配的 " 木桶效应 ",如果你用 A 公司的芯片做视觉,B 公司的芯片做运动控制,中间就需要大量的底层驱动对齐和通信延迟优化,为此开发者 80% 的精力都在调接口、对协议,而不是在优化机器人的算法,从而导致产品迭代速度被英伟达生态甩开。

如果说在具身智能领域," 芯片决定下限、数据决定上限 " 已经成为共识,那么中美在数据获取路径上的差异也愈发明显。

美国以英伟达的 Omniverse 与 Isaac Sim 等平台为代表,试图构建一个高保真虚拟世界,在其中 1:1 复刻真实物理规律(重力、摩擦、光影等),让成千上万的虚拟机器人以远超真实时间的速度进行操控训练,例如学会如何拿鸡蛋、避障、抓取不规则物体等。训练完成后再将策略和模型下发到现实世界中的物理机器人,由此大幅降低真实试错成本。

相比之下,中国企业则更多倾向于利用硬件成本优势采用 " 泥腿子进城 " 的现实路线。既然机器人本体足够便宜,那就先造出几万甚至十几万台,让它们直接进入工厂、仓储中心、生产线等真实场景,在实践中不断摔倒、碰撞和试错。而对于那些成本可控、风险可管理的场景,损坏一台机器人或一个伺服电机的代价远低于获取真实世界数据的长期价值。通过这种 " 暴力堆量 " 的策略,中国企业从一线场景中点滴积累 " 原汁原味 " 的物理数据,用于训练和优化多模态模型。这两条路径,一条依赖算力,一条依赖场景,本质上代表了不同资源禀赋下的最优选择。

写在最后:回望整个产业,我们发现一个熟悉的规律正在重演,那就是在技术浪潮初期,最热闹的是终端产品,但最稳定的价值,却掌握在 " 卖水人 " 手中。从算力、芯片到关键部件与数据基础设施,这些看似不显眼的环节,才是真正决定长期格局的根本。

而魏哲家的那句 " 跳来跳去没用 ",并非对人形机器人的否定,而是对产业认知的一次纠偏,即在这场关于人形机器人的竞赛中,肌肉会迅速贬值,硬件会不断内卷,唯有算力与智能,才是长期稀缺资源,而也是我们必须要占领和夺取的。

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容