关于ZAKER 合作
虎嗅APP 10小时前

小鹏,“重拾”执念

出品丨虎嗅汽车组

作者丨李赓

头图丨小鹏汽车

上周,小鹏的 " 科技日 +X9 增程 " 组合活动狠狠地刷出了一波存在感,但这次靠的并不是车,而是机器人。

小鹏汽车董事长何小鹏的微信视频号页面

上周三(11 月 5 日)在 " 科技日 " 活动上,何小鹏亲自发布了全新一代人形机器人 "IRON"。本来这只是一个非常简单的技术成果展示—— IRON 在现场只做了一个非常基础的外观展示,并且在现场进行了很短暂 " 猫步 " 行走。

官方视频不抽帧转 GIF

虽然展示的确很短暂,但短短十数米的行进,却展示出了相当高的类人能力:柔和的肩颈舒展,自然的胯部摆动,流畅的转身衔接。让部分人在看到官方视频之后,开始集中 " 质疑 "(其中大部分人都并非怀疑,只是凑热闹刷感叹思):" 这肯定是真人套壳,里面一定有人!"

再加上 IRON 的女性化外观特征带来的相关讨论,进一步推高了整件事的热度。

本身快反能力就不弱、且最近两年深受小米影响的小鹏,还选择了在第一时间 " 火上浇油 ",当晚就临时加拍了 " 何小鹏拉开机器人拉链 " 的短视频。

实际剪开的只是机器人的 " 包装部分 "

在周四的 " 超级增程 " 发布会进行前,又专门临时增加一个环节:让几位女性员工 " 直接剪开机器人小腿的‘皮肤’和‘肌肉’ ",并且何小鹏在这个环节一度 " 哽咽 ",表示 " 自己拉开机器人拉链证明不是真人的时候有点心酸 ",还说自己联想到了电影《让子弹飞》中的 " 剖开肚子看吃了几碗粉 "。

在小鹏自己的 " 希望这是最后一次证明机器人是它自己 " 标题基础上,甚至有的媒体还进一步渲染成了 " 中国的机器人,非要撕开衣服才能自证清白?"

如果只看传播(包括流量以及传播的广度等指标),这大概是小鹏自从 2021 年推出那一套飞行汽车概念以来,最火的一次 " 科技日 " 活动。并且 IRON 机器人的大火,似乎将对小鹏接下来实际经营更关键的 " 第二代 VLA 模型 "、" 物理世界 AI 模型 " 和 "X9 超级增程 " 等新进展的风头全部盖过。

在今年 2 月接受媒体采访时,何小鹏曾表示:"AI 的最大价值在于改变物理世界(原子),不仅是改变数字世界(比特)。数字世界的改变速度快,但影响浅;物理世界速度慢,但影响深。我更想通过 AI 来改变物理世界(如汽车、机器人),所以我们要做一家 AI 汽车公司。"

显而易见,何小鹏重新拾起了那个一度放下的 " 执念 " ——将 "AI 改变世界 " 的目标追求。

大火的 IRON 机器人和低空经济,不确定性拉满

在虎嗅汽车看来,此次小鹏 IRON 机器人最值得探讨的点只有三个:

这段 " 猫步 " 究竟背后有多大的技术含量?

新机器人折射出的小鹏机器人技术实力几何?

新机器人的出现对于未来的商用化意味着什么?

先说第一点," 猫步 " 本质是一种步态能力。IRON 机器人此次表现出来的 " 柔和的肩颈舒展,自然的胯部摆动,流畅的转身衔接 ",核心原因是其在硬件层面打造了比 " 宇树类 " 人形机器人更复杂的机械运动结构,还利用大模型匹配了一套驾驭这种硬件能力的生成式算法(这一点和 " 宇树类 " 人形机器人有共通之处)。

IRON" 正式版 " 机器人的骨架行走视频片段,可以重点留意其腰部的复杂设计

现场演示的 " 闪光舞 " 的骨架版,可以明显看到其腰胯部极其灵活,肩部关节活动范围很大

相比之下,今年 4 月的 IRON 工程版的腰胯部位 " 简单 " 非常多 图自动点科技

硬件方面的变动,从去掉 " 皮肤 " 和 " 肉 "(官方将其称之为肌肉,实际上动作主要依赖内部的核心骨架完成)的机器人运动和结构细节不难看出,此次发布的 IRON" 正式版 " 的 " 肩部 "、" 腰部 " 和 " 胯部 " 三个位置,相比小鹏今年 4 月在车展上发布的 IRON" 工程板 " 复杂度直接上了一个数量级(工程版只是简单用了好几个电机来提升自由度,正式版电机位置有所变动还在电机之外增加了很多机械结构)。

硬件结构升级带来了更高的自由度,主要体现在机械关节各方向的活动 " 角度 " 上。在硬件能力提升的基础上,软件层面也实现了 " 升级 "。

IRON 机器人的核心特点是将生成式大模型嵌入运动控制与导航管线,形成 " 端到端的动作生成 " 能力。换言之,其动作并非完全预设,而是能根据实际情况进行细微调整,例如发布会演示中的 " 猫步 " 转弯。为支撑生成式大模型及多传感器数据的计算,IRON 搭载了 3 颗图灵芯片,算力达到 2250TOPS。

小鹏汽车机器人副总裁兼 AI 技术委员会负责人米良川

小鹏汽车机器人副总裁兼 AI 技术委员会负责人米良川,接受包括虎嗅汽车在内的媒体交流时解释了生成式算法带来的不一样操控逻辑:"IRON 机器人的前进并不是每个动作逐个给出指令去 " 提线木偶 ",人给出的只不过是 " 向前 "、" 向左向右 " 这样原始意图,最终的运动实际上是机器人 " 大脑 " 生成出来的。"

这个过程本身也更像人类的思维和执行逻辑,我们走路的时候并不会一直自己想怎么迈腿、怎么可以获得持续前进的动力。

" 这一版 RION 机器人的最大目的,就是希望能够选取一个足够细分的场景,来探索让机器人足够像人,到底有多少挑战要应对。" 米良川在采访中表示。

是的没错,虽然已经火出圈了,但实际上仍是个非常早的产品。

去年年底的 IRON 工程版,小鹏当时还在宣传机器人 " 打螺丝 "

值得注意的是,随着 IRON 版的正式推出,小鹏的机器人战略正式发生了一次方向上的 " 转变 "。在今年年初发布 IRON 机器人工程版的时候,官方专门提到 "IRON 已在小鹏广州工厂投入实训,未来将应用于工厂自动化生产线和门店服务等领域,提升生产效率与服务质量。"

但在本次科技日上,何小鹏本人明确 diss 了 " 在工厂打螺丝 " 和 " 在家做家务 " 这两个场景,原因分别是 " 当前灵巧手的寿命距离商业可用距离很远 " 和 " 家务场景非常复杂,机器人不仅服务能力难构建还容易引入新的安全问题 "。

IRON 机器人大火,但是第一批应用场景修正为 " 大花瓶 "

最新的 " 目标场景 " 直接变成了可以用 " 大花瓶 " 来概括的 " 导览 + 导购 + 导巡 ",这些场景中很多已经进行了基础的数字化和非人型机器人覆盖。

与场景的选择相对应,目前最新版的 IRON 机器人的灵巧手采用的仍是 " 谐波电机 " 直接充当手部关节的方案(直接用电机来当关节最简单但并不完美)。这种方案手指部分的输出力矩最小,且在维护和维修上挑战也比较大,因此目前的灵巧手的确不足以支撑具体的场景应用。

时隔半年就应用方向大变,从侧面说明了小鹏人形机器人业务依旧存在非常多的不确定性。

正如米良川自己在采访环节被问到 " 小鹏机器人的未来主攻方向 " 时表示:" 机器人的落地路径只能长期并行推进,导览、导购、导巡这几个场景先进行试点,然后根据真实数据找出问题,驱动能力提升。工厂与家庭场景也会推进,但目前资源的匹配肯定不是最优先级 "。

在本次科技日上,何小鹏将 " 高阶人形机器人 " 的量产时间定在了 2026 年底,但究竟是怎么样的 " 人形机器人 "?又以多大的规模量产,实际用途能够如何落地?仍然是一个大大的疑问。

同样的 " 不确定感 ",也同样出现了在小鹏 " 低空 " 板块。

全新的全倾转构型低空机型 A868 模型

本次 " 科技日 " 上,这一块的信息增量最简单也最少,一个是宣布之前的 " 陆地航母 " 已经步入量产前夜;另外一个是公开亮相了全新的、采用全倾转构型低空机型 A868,预计将实现 500km 长航程,最高航速预计可达 360 公里 / 小时。

虽然官方透露了即将在敦煌推出西北首条低空自驾旅游线,但就国内近些年来的各种低空飞行器旅游开发的进展而言,往往是落地之后就没了声音。最典型的就是亿航,在国内搞了一堆设备落地,也经常能看到在各地开通航线的新闻,但实际上都没有彻底进入公开的商业运行。

然后是全新的机型 A868,从小鹏总部现场展出的模型来看,采用了 V 形尾翼 6 发构型。但目前所展出的仍是一个相对简单的展示模型。相关的机型认证和适航认证,参考此前的机型经验,往往仍需要 3-5 年复杂的历程,为时仍非常早。

智驾最关键,但最终还要看实测

相比远未成熟的机器人和极难落地的低空交通工具,小鹏的智驾 AI 能力发展对于其基本业务而言显然更加重要。

作为小鹏之前在整个汽车圈 " 技术领先 " 的最重要支撑,过去一年的时间里,小鹏的智驾能力排位在业内不仅没有提升,反而有小幅下滑的趋势。在本次 " 科技日 " 上,小鹏将其 VLA 模型升级为了 " 第二代 "。

从视频输入到直接的动作输出,是最贴近人类的智驾神经模型

用最技术的官方描述来概括:输入以真实世界物理信号(尽量使用视频等传感输入),输出走端到端的推理流程,尽量减少文本作为中介,追求极致的数据利用效率与端到端能力。降低对标注的依赖,形成隐式推理的端到端能力,同时保留必要的文字 Token 化用于辅助训练。强调数据、算力、数据闭环的重要性,以及在车端本地化推理、低延时与高帧率的实现。

用人话来说,就是 " 修改了 VLA 大模型的结构,不像过去的数据处理流程那么笨和僵硬,从而在模型稍微复杂的前提下,通过使用更多算力来让机器学习到更多的现实数据并且生成规则,实现了多方面的表现提升。"

从小鹏官方发布会现场展示出来的 Demo 片段来看,表现的确不错

究竟小鹏在第二代 VLA 模型中应用了哪些细节性的创新,哪些变动最为关键性,并没有在发布会现场和会后的 Workshop 提及,主要原因是当前国内智驾行业太过激烈,小鹏内部也不愿意放出特别多技术细节。

但总体思路依旧不难理解——过去小鹏包括算力在内的软硬件性能有限,所以在设计大模型的时候往往从一开始就 " 妥协 ";但如今软硬件性能涨上来了,所以从底层再自我颠覆一轮,就能实现大模型整体设计的变革提升。

但有两个刘先明亲口提到的细节必须一提:

在第一代 VLA 模型被放弃之前,内部是两条路线并行,但一代当时出现了很多 Bug(虎嗅汽车此前在 G7 的 VLA 大模型试驾中的确发现了不少 Bug);

第二代 VLA 模型的出成果,是坚持许久之后突然 " 涌现 " 出来的。

发布会上故意强调希望出自一个 " 偶然版本 ",不得不让人多想

第一点反映出来的是,AI 发展中 " 涌现 " 自带的部分不确定性,即便在最重视 AI、在 AI 上拼命投入的小鹏这里,依旧仍会保留部分的不确定性;第二点媒体更是直接向刘先明提问 " 这种涌现是不是偶然事件 ",他在技术之外做了个相对模糊的回应:" 第二代 VLA 从去年开始就做规划,还做了很多数据和 Infra 的积累,我们知道这个方向大概率就是对的,只不过出成果的确要不断投入直到找到。"

有了更强的第二代 VLA,小鹏还额外做了几件事。首先就是向全球商业伙伴开源,注意这里并非 " 免费开源 ";其次是大众汽车集团将成为除小鹏外的第二代 VLA 首发客户;最后是 Robotaxi,因为第二代 VLA 带来的能力提升,小鹏将业务开展的时间直接提前到了 2026 年,不仅要推出三款 Robotaxi 车型,还要启动试运营。

就目前而言,仅凭发布会上的信息,还很难确认小鹏的第二代 VLA 表现如何,等待媒体评测开启之后,虎嗅汽车也将在第一时间推进详细的测评。

有 " 执念 " 是好事,也是坏事

今年年初,在被问到 " 董事会是否赞成其造飞行汽车和机器人时 ",何小鹏曾给出过非常明确地说明:董事会都不支持,是他自己一个人强行说自己相信。甚至连 " 为什么技术能突破?"," 为什么有场景?"," 为什么用户有需求?" 这样的问题都无法回答。

唯一支撑他的,就是开篇提到的那个逻辑:"AI 的最大价值在于改变物理世界,不仅是改变数字世界。"

图自 网络

这种思维在大洋彼岸的 Elon Musk 身上也有所体现,在本次开完科技日之后,有人就专门做了一张图,将小鹏与特斯拉目前的一系列创新方向进行对比,突出两者有多相似,持续不断投入 " 真金白银 " 去创新寻找未来。

寻找新机会的做法没有错,但这些新方向如何和主营业务结合?新方向如何一步步走到成熟落地?如何不辜负所有消费者的期待?如何逐步形成一个完整的 " 品牌势能 "?都是企业需要面对的艰巨挑战。

最典型的负面案例,就是展示自身技术实力的时候 " 吹牛吹大 " 了。

这就好比一个厨师,天天向顾客吹嘘自己的佛跳墙多么绝妙。然而,每当顾客点这道菜时,他总是推说 " 还差些火候 ",建议对方先点份凉菜尝尝,并承诺 " 佛跳墙的位置给您留着,让您第一个尝鲜 "。一次两次,顾客或许还会抱有期待;次数多了,只会让人觉得他是个骗子。

在小鹏如今官方的定位,已经从去年刚喊出来的 " 面向全球的 AI 汽车公司 " 升级为 " 面向全球的具身智能公司 " 之后,小鹏的各条业务线如何在现实的产品和应用场景中表现出足够强的能力和竞争力,将会成为小鹏接下来一段时间的重中之重。

相关标签

相关阅读

最新评论

没有更多评论了
虎嗅APP

虎嗅APP

有视角的商业资讯与交流平台

订阅

觉得文章不错,微信扫描分享好友

扫码分享