关于ZAKER Skills 合作

深圳百亿估值具身智能企业 +1:跨维智能 B 轮融 10 亿 拟开启 IPO 冲刺

《科创板日报》6 月 30 日讯(记者 敖瑾)具身智能融资热持续。

继周一的智平方、自变量后,今日又有一家深圳具身智能企业发布融资动态:跨维智能宣布完成 B 轮融资,融资金额 10 亿元,参与资方包括深创投、前海母基金、工银资本、南山战新投以及成都科创投等。公司本轮投后估值也进入到了百亿区间。

另据公司方面透露,本轮融资之后,跨维将加快 IPO 相关筹备。

跨维智能早在这轮具身智能热潮掀起之前的 2021 年就已经成立,创始人贾奎目前也是香港中文大学(深圳)数据科学学院终身教授,深耕计算机视觉、三维生成式 AI 等领域。

《科创板日报》记者此前曾于 2025 年 3 月初前往跨维智能采访,彼时公司对能力的展示主要还是围绕工业机械臂展开:机械臂在产线上完成零件的识别、分拣以及装配等。但到今年 6 月下旬,记者再次走进跨维智能,黄色外壳的人形机器人已经成为了公司随处可见的更显眼的主角。

跨维对外的技术叙事也随之和之前有所不同。在彼时的采访中,公司更多强调自己是一家从工业场景里长出来的物理 AI 企业,核心能力被概括为一套从数据采集、仿真训练到端侧部署和反馈迭代的 AI 工具链。

到了今年,随着世界模型成为具身智能行业的新关键词,跨维过去积累的仿真、合成数据、空间感知和模型训练能力,也被放进了世界模型这个行业框架中重新解释。

贾奎则对《科创板日报》记者表示,跨维的底层方向一直没有改变。" 从 2016 年我个人做相关研究,到公司 2021 年成立,做的始终是同一件事,即用 AI 来解决三维物理世界的感知、决策和执行问题。无论过去落在工业机械臂上,还是现在更多落在人形机器人和商业服务场景中,本质都是围绕数据如何产生、模型如何训练、模型如何与机器人本体结合,以及如何在不同场景中实现泛化、精度和稳定性。"

但他坦陈,行业的变化还是给公司带来了一些变化,最直接的就是原来的逻辑更容易被听懂。" 具身智能热起来之后,客户更愿意尝试这些新技术,更早之前向客户讲物理 AI、具身智能、机器人泛化能力,很多人既听不懂也不确定到底可以怎么落地应用。"

资本市场的态度无疑也发生了变化。去年下半年以来,一级市场的资金正在从单纯的人形机器人本体,加速流向 " 具身大脑 "" 世界模型 "" 空间智能 " 等底层模型公司。就跨维而言,本次融资也是其成立以来单轮录得的最大规模融资额。

而除了跨维智能,包括极佳视界、无界动力、脸谱心智等以世界模型为主要技术标签的项目,都在近期完成了新一轮融资。其中,极佳视界对外表示今年三个月累计融资达到 35 亿元。海外方面,李飞飞创立的 World Labs、杨立昆创立的 AMI Labs 也都在今年早些时候完成了大额融资,前者今年融资额达到 10 亿美元,后者种子轮融资额就高达 10.3 亿美元。

《科创板日报》记者在采访中了解到,世界模型概念热度的显著提升,与 VLA 路径局限性的逐步显露紧密相关。

VLA 即 Vision-Language-Action,通常指模型基于视觉输入和语言指令,直接输出机器人动作。贾奎告诉记者,VLA 本质上是一种 "shortcut(捷径)":基于机器人已经看到的场景和语言任务目标,直接输出动作。但在采集了大量真机数据之后,行业逐渐意识到这种方式在泛化学习上效率较低。

在贾奎看来,世界模型本质上要解决的就是人工智能如何学习物理世界运行规律的问题。他也提到了 Sora 等视频生成模型的局限," 视频生成模型能够生成逼真视频,并不意味着模型真正学到了世界的内在规律。因为真实世界的规律不是二维的,不是图像的,也不是停留在 RGB 像素里的,而是三维物理世界的内在规律。"

基于这种判断,跨维所追求的世界模型,也区别于视频生成模型的路线。据公司方面介绍,跨维的世界模型,在架构设计上强调隐空间中的 space-time 表征,并将视觉输入、机器人本体状态、动作等多源异构数据统一到一个坐标空间之下,从而提升数据应用效率、模型学习效率以及模型推理后驱动机器人执行任务的效果。

简单理解,跨维想做的世界模型,是让机器人不只是把世界看成一帧帧画面,而是在自己的 " 大脑 " 中建立一套会随时间变化的三维世界模型。它要知道物体、身体和动作之间的关系,并据此完成分拣、抓取、装配、移动等任务。

技术最终还是要回归到商业落地。贾奎在采访中表示,尽管现在风险资金对具身智能的关注度空前,但投资人也越来越关注技术能否实现商业的闭环。

目前,跨维大致有两类业务,一类是用 AI 模型赋能第三方机器人,让它们在智能制造场景中完成分拣、装配、插拔等任务;另一类是用同样的模型能力驱动自研的人形或类人形机器人,进入商业服务和社会场景。

在商业化方面,跨维还试图对 "Physical Token 经济学 " 进行定义。在大语言模型领域,模型的调用、推理和收费可以围绕 token 展开;推及物理 AI,消耗 token 的主体变成了机器人这一 physical agent,它消耗的对象也不同于大语言模型中的文本,而是三维物理世界里的多源异构数据。

由此,Physical Token 经济学的本质,是给物理 AI 建立一套成本与收益账本:数据如何更高效获得,模型如何更高效训练,机器人每一次动作、每一次推理、每一次现场执行,能不能产生高于成本的商业回报。

贾奎表示,如果后续 Token 消耗本身能够给客户带来增量价值,公司也可以进一步探索基于增量价值的持续收费模式。

相关阅读

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容