
编辑 | 铅笔道 邹蔚
封面图 | ChatGPT 创作
最近,深圳一家机器人公司悄然完成 10 亿元 A 轮融资。
这家公司是 RoboScience 机器科学。它名气远不如许多同行,但很早就开始研发具身 AI 大模型,也就是给机器人安上大脑。
大脑让机器人能够自己理解任务、判断环境、操作物体,是具身智能最难攻克的技术堡垒。
这个赛道增长很快。咨询公司 MarketsandMarkets 预测,全球具身 AI 市场规模将从 2025 年的 44.4 亿美元,增长到 2030 年的 230.6 亿美元(约合人民币 1570 亿元)。
RoboScience 机器科学创立于 2024 年,创始人田野是 "90 后 ",四川自贡人。
田野本科毕业中科大物理系,在斯坦福大学 AI Lab 获得硕士学位。毕业后,田野在苹果公司工作 7 年,担任苹果公司 Apple AI Platform 负责人。
最近,RoboScience 机器科学发布了通用具身大模型 Visics。铅笔道在深圳与田野及公司联合创始人(兼执行总裁)汪涛交流。
这是他们首次向外界解答市场最关心的问题:具身 AI 有哪些真实机会?
具身 AI 大模型为什么火了?
具身 AI 大模型同时踩中了三个趋势:大模型从数字世界进入现实场景,机器人行业急需解决泛化难题,资本正在寻找 AI 下一轮商业化入口。
ChatGPT 给人启发是:如果大模型可以理解语言,机器人能不能也通过大模型理解真实世界里的物体、空间、力和动作?
这正是具身 AI 大模型路线让行业兴奋的地方。
工厂里早就有机械臂,仓库里也有 AGV 小车,汽车产线上更是高度自动化。但这些机器人通常只能在相对固定、标准、封闭的场景里工作。也就是说,这些传统机器人没有解决泛化能力,脱离原有环境和任务,可能就歇菜了。
真正有价值的机器人,不应该只会抓一种瓶子、搬一种箱子、叠一种衣服。它应该能面对不同形状、不同材质、不同摆放方式的物体,仍然知道自己该怎么做。
它也不应该只能绑定某一种机械臂或某一种灵巧手,而应该能把学到的能力迁移到不同机器人身上。

RoboScience 机器科学希望让机器人拥有一个通用 " 大脑 ",真正丢掉遥控器,成为自主理解任务、判断环境、操作物体的智能体。
过去卖机器人,更像卖硬件,一台一台交付与部署。未来如果机器人 " 大脑 " 可以适配不同硬件,它就可能变成软件、控制器、云服务,甚至类似大模型 API 的生意,是一门边际成本极低、收益极高的生意。
目前,英伟达、Google DeepMind、OpenAI、亚马逊、微软、英伟达、Meta、特斯拉等巨头都在关注这个方向。
具身 AI 大模型行业痛点
具身 AI 大模型难在 " 真实世界不标准 "、" 数据太少 ",它要同时解决数据、泛化、物理、仿真、跨本体、长任务和安全落地几件事。
RoboScience 机器科学开发了具身智能大脑 Visics(vision+physics),它能做两件事:
一,理解人给它的任务;二,判断物体应该怎样变化,然后指挥机器人把这件事做出来。
基于这一思路,希望解决行业四个痛点。
第一个痛点,是机器人泛化能力差。
RoboScience 机器科学的解法是,不把模型绑死在某一种机器人身体上,而是尽量让 " 大脑 " 和硬件解耦。也就是说,同一个模型未来可以适配不同机器人、不同灵巧手、不同场景。这背后的商业想象是:它不只是卖一台机器人,而是卖一种可以赋能很多机器人的操作能力。

第二个痛点,是机器人太依赖人工采数据。
RoboScience 机器科学的判断是,具身智能如果想拥有 ChatGPT 那样的基础模型,不能只靠真人一点点采数据。而现实世界里,又没有那么多机器人每天在工厂、仓库、家庭里干活,所以真实机器人数据天然稀缺。
RoboScience 机器科学选择的路径是互联网视频加仿真数据。互联网视频提供真实世界里人和物体互动的样本,仿真系统则在虚拟世界里大量生成机器人操作数据。
它把这个思路概括为 " 算力即产能 ":不靠人海战术建数采厂,而是尽量用 GPU、自动化清洗标注系统和仿真引擎来生产训练数据,把 " 数据生产 " 变成 " 算力生产 "。
第三个痛点,是机器人不理解物理。
这也是 RoboScience 机器科学 自研物理仿真引擎 RoboMirage 的原因。它希望先在虚拟世界里训练机器人,让机器人在仿真环境中学习不同物体如何被抓取、折叠、拖拽、旋转、插入和组装,让机器人上岗前,先在一个足够真实的虚拟世界里练熟。
这也是全球行业共识正在形成的地方。英伟达最新机器人基础设施里特别强调多物理仿真和复杂灵巧操作,DeepMind 也把 Gemini Robotics 描述为能推理物理世界、规划复杂任务并做动作的模型。

第四个痛点,是很多机器人只能完成短动作,难以完成长任务。
RoboScience 机器科学把 Visics 分成两部分,具身世界模型和通用操作模型,并用连续的 3D 点云轨迹,描述一个物体在空间里怎么移动、怎么变化,机器人不是只学一个个孤立动作,而是开始理解任务过程。世界模型负责 " 想象 ",也就是先在脑子里想清楚怎么做,再让身体动手做。
具身 AI 大模型的商业机会
田野透露,RoboScience 机器科学的机器人 " 大脑 ",将优先服务于 B 端的物流、零售、商超等场景的本体。
这些地方物体种类多、任务重复性高、而且对 " 泛化操作 " 有真实需求。家庭机器人当然想象空间大,但家庭环境太复杂,对成本、安全、稳定性的要求更高。
全球市场也在印证这一点。Agility Robotics 的 Digit 已经被用于制造、配送和物流场景,公司即将上市,估值约 25 亿美元,其客户包括 Toyota、Schaeffler、Mercado Libre 等,主要任务包括仓储搬运等重复、危险或劳动力紧缺的工作。
Figure 02 已经进入宝马在美国斯帕堡的工厂。宝马官方披露,Figure 02 在 2025 年支持了超过 3 万辆宝马 X3 的生产,每周一到周五工作十小时。
这并不意味着家庭机器人没有机会。1X 机的 NEO 已经开始面向早期用户,使用 Redwood AI 学习和重复家庭任务,但复杂任务仍需要远程专家监督。

第二,成为机器人 " 大脑 " 供应商,也就是成为机器人行业的基础软件层。这是 RoboScience 机器科学 最值得关注的商业机会,和全球趋势是一致的。
比如,美国公司 Physical Intelligence 目标也是开发一种能用于不同机器人的基础软件,不必为每个机器人、每个任务单独写软件。Skild 也推出了 Skild Brain,称其基础模型可以运行在几乎任何机器人上,从装配线机器到人形机器人,目标是让机器人具备更强的思考、导航和响应能力。
RoboScience 机器科学 的大脑售卖方式类似软件服务 MaaS,也可以像大模型卖 token 一样,按操作 token 或年包计费。
第三,卖端侧控制器,也就是把大模型能力装进一个控制设备里,再卖给机器人公司、机械臂公司或灵巧手公司。
比如,2024 年全球工厂新安装工业机器人约 54.2 万台,但传统工业机器人擅长的是标准化任务,比如焊接、喷涂、搬固定零件。它们不擅长处理复杂、杂乱、不规则、经常变化的任务,比如仓库里不同尺寸的包裹,商超里不同包装的商品,工厂里柔性物料和异形件,餐饮后厨里的非标准操作。
控制器的价值就在于:给已有机器人装上新大脑,具备更强的泛化操作能力。
装上控制器,工业机器人有望突破传统自动化的边界," 固定程序机器 " 变成 " 能适应变化的智能劳动力 "。
最大机会:一个大脑、多种身体
如果每一种机器人都要单独训练一套软件,这个行业就很难规模化。" 一个大脑,多种身体 " 变成了具身智能行业最有想象力的方向之一(即上一节谈到的机会二),值得单独拎出来说。
它的意思是:未来不一定每台机器人都从零开始学习。也许会有一套通用机器人大脑,能够适配不同机器人本体。
这有点像电脑和操作系统的关系。电脑品牌不同,硬件配置不同,但很多软件可以在同一个系统上运行。
机器人行业当然更复杂,因为机器人不仅要计算,还要移动、抓取、碰撞、受力。但商业逻辑有相似之处:如果机器人大脑能跨硬件复用,它就不再只是某一家机器人公司的内部算法,而可能变成行业基础软件。
这也是为什么全球不少具身智能公司都在往这个方向走。
RoboScience 机器科学 不想只把模型绑在某一种硬件上,而是希望 " 大脑 " 和 " 身体 " 解耦。按照他们的设想,这套能力可以通过软件输出,也可以装进端侧控制器,卖给机器人公司、灵巧手公司或集成商,还可以和自有机器人本体一起进入具体场景。
这个逻辑背后,是具身智能商业模式的变化。
如果只卖机器人,本质上还是硬件交付。一台一台卖,一台一台部署,周期长,成本高。
但如果卖的是 " 大脑 ",商业边界就会大很多。它可以服务不同硬件,也可以进入不同场景。客户已有机械臂,缺的是泛化抓取能力,可以接入大脑;灵巧手公司缺操作能力,也可以接入大脑;场景方已有自动化设备,也可能通过控制器升级。
这当然很难。
不同机器人的身体差异很大。二指夹爪和五指灵巧手不是一回事,机械臂和人形机器人也不是一回事。一个模型要理解不同身体的结构、力量、自由度和运动边界,再稳定完成任务,非常难。如果这件事容易做,行业里早就遍地开花,不会等到现在才被真正讨论。
但这也正是壁垒所在。跨本体泛化一旦跑通,它的商业价值将远不止于卖一台机器人。