WAVES 新浪潮 2025 邀你一起走向中国创投的「新纪元」。
这是属于中国创投的新纪元。当下的中国创投市场,既是周期筑底的转折点,也是结构性转型的深化期。在政策主导、国资与资本高度集中的新生态下,唯有顺应趋势、灵活调整,方能在不确定性中捕捉确定性机遇。
6 月 11-12 日,杭州良渚文化艺术中心,36 氪 WAVES 新浪潮 2025 大会以「新纪元」为主题,汇聚创投领域顶级投资人、新锐企业创始人,以及深耕科技、创新、商业的科学家、创作者与学者,共同探讨 AI 技术革新、全球化浪潮与价值重估等前沿议题,拆解他们眼中的商业理想和未来世界,一起讨论、寻找、走向中国创投「新纪元」。
大家中午好!很高兴和大家做一个交流。刚刚和具身智能相关的主题也有一些,大家可能有有些自己的理解,我们觉得具身智能坦白讲是可能比大家想象的更加重要。这个重要性体现在哪里呢?大家想一下过去 30 年,中国最核心的能力提升是在制造业,我们的制造业已经占到了全球的 30% 以上的体量,虽然我们的制造业很优秀,但一直在价值链最低端。具身智能是我们去提升整个制造业如何在价值链上往上攀升的特别好的技术,甚至把它叫做国运级的技术也不为过。
今天我们做的事情是通过有鹿通用的机器人大脑,把它适配到一个传统的设备上,升级成一个智能的机器人。今天这款智能机器人在海外的售价超过 4 万美金,而且供不应求,原因很简单。你在欧美任意请一个人,一年的年薪都超过 5 万美金,而我们这样一台机器人,它设计的使用寿命是 6 年,所以它是一个极其优秀的 ROI。
通过这样一个简单的例子,我们能看到,我们通过具身智能的技术,把中国非常优秀但特别传统、在价值链最低端的产品,它的价值提升了 7 倍,接近一个数量级,我觉得这是具身智能对于中国来说最大的意义。
显然,我们这个通用的大脑不仅仅可以放到一个清洁的设备上,我们真正在做的是 " 一脑多型 ",就是怎么能够把我们具身智能的大脑适配到各种各样不同的传统设备上,把它升级为一个机器人,这是我们真正应该做的事情。
下面,介绍一下我们的模型。我们的模型本质上是一个左右脑融合的通用机器人模型。在这个部分,目前我们是放了一个开源的通义千问,它显然有非常好的语言交互能力、推理能力,但就像人的大脑一样,我们的语言脑是左脑,但是我们仍然需要一个右脑,上面右脑的部分是有鹿真正投入最核心的时间精力开发的。右脑最核心做什么事情呢?是做两件事情:一件事情是空间的智能,一件事情是决策的智能。什么叫空间的智能?所有的传感器的数据做输入,都可以恢复出一个三维世界,并且三维世界的编码和我们的语言模型特征做融合。什么是决策智能呢?通过预测未来来决定机器人接下来的行为序列应该是什么样子。
大家可能会问,我们能做 VQA 有什么用?本质上这个问题就好像我们问 DeepSeek 和之前的大语言模型有什么不一样,最核心的一点是 DeepSeek 有推理能力,而今天很多的情况下,仅仅靠上一代的小模型的模式识别的技术已经不够我们用了,我们必须让我们的模型有推理的能力,才能真正完成具身智能的能力,而推理这件事情只有靠语言才能完成。即便是人类的大脑,我们不用语言也是不能做推理的。
我们通过这样一个全新的技术,有鹿成立大概两年左右的时间,我们已经获得了 10 项全球的算法冠军,而且和我们一起参加这些比赛的都是英伟达、Facebook、谷歌等全球 AI 巨头。同时,我们也获得了很多的行业大奖。
我们有两类产品,一类是刚刚提到的大脑的模式,有点像机器人行业的 Tier1 的供应商,而我们的目标客户就是现在在中国已经非常成熟,占据了庞大市场的传统的设备供应商。我们的使命就是通过这样一款具身智能的大脑,帮传统的制造业去做智能化的升级。第二个,有鹿也会围绕一个场景去实现自己的或者提供自己完整的机器人产品的矩阵。这个场景是我们觉得世界上最大的市场,就是家庭市场或者家庭周边的市场,围绕这个场景,我们会去提供如清洁、物流、服务等各种各样不同的机器人。
简单介绍一下进展,这款清洁的机器人是我们 2024 年 9 月份发布,到现在大概 9 个月的时间,我们已经签署了超过 4 亿人民币的订单,已经成为这个行业的销售冠军。
人形机器人,我们也在投入,但是我们投入的方式和大部分人形机器人不太一样,比如说刚刚过去的亦庄人形机器人马拉松,平均一个人形机器人后面跟了三个人,一个人拿遥控器,一个人防止它摔倒,另外一个人拿水浇它,防止它过热。现在绝大部分做人形机器人的公司本质上是在做小脑、运控,我们的想法很简单,我们觉得一个人形机器人所看到的世界、要解决的智能性任务,和一个轮式的机器人没有太大的区别,所以我们希望用一个通用的大脑去服务好所有的机器人产品。这里面最核心的点是什么?就是这张图,无论是右边轮式机器人用到的模型,还是左边人形机器人用到的模型,它的底层模型是同一个模型,轮式或轮 + 臂的机器人今天已经开始大规模出货。不管是大语言模型,还是具身智能领域,有一个叫 scaling law 特别重要,我们搜集了足够广泛的数据,才有可能让我们的模型往前走一小步。我们最核心的想法是,今天既然我们轮式、轮 + 臂的机器人已经大规模推向市场,如果我们是用同一个底层模型去学习的时候,它不仅仅可以让我们的轮式、轮 + 臂机器人变得越来越智能,也能够让我们的人形机器人变得越来越智能,所以这是我们最核心的观点。我们最核心的想法是通过我们的大脑,可以让各种各样的设备都变得越来越智能。
谢谢大家!以上是我今天的分享。