7 月 27 日,2025 世界人工智能大会腾讯论坛期间,腾讯 Robotics X 实验室与福田实验室联合发布具身智能平台 Tairos(钛螺丝)。雷峰网 AI 科技评论获悉,其由模型算法和云服务两部分组成,模型层包含多模态感知模型、规划大模型以及感知行动联合大模型,云服务平台则包含仿真平台、数据平台以及开发工具等。
感知、规划、行动分别对照着人类的右脑、左脑和小脑。
现场,搭载了 Tairos 的宇树机器人 " 小腾 " 可以听懂并遵照 " 到我身边来 " 的指令,看得见也说得清桌面上的物体,能弄明白物体增添变化,记得起自己昨天在做什么。这意味着,机器人开始具备长记忆能力。
除了宇树,腾讯公布的首批合作伙伴名单还包括越疆科技、乐聚机器人、帕西尼感知科技、擎朗智能、众擎机器人科技等机器人本体公司。作为国内首个以模块化的方式提供大模型、开发工具和数据服务的具身智能软件平台,Tairos 通过即插即用的方式面向机器人行业开放。
合作模式折射了腾讯战略的调整。自去年以来,马化腾先后在多场合明确," 腾讯的目标是与各大机器人厂商携手合作,而非亲自下场制造硬件 "。
据悉,Tairos 背后的腾讯 Robotics X 实验室成立于 2018 年,此前曾推出四足机器人 Max、轮腿机器人 Ollie、人居环境机器人 " 小五 " 以及三指 / 五指灵巧手 TRX-Hand、机械臂 TRX-Arm,覆盖了操作、运动、感知、智能、硬件设计等机器人核心技术栈。本次 Tairos 具身智能平台或意味着其蓝图进一步清晰化。腾讯首席科学家、Robotics X 实验室主任、福田实验室主任张正友指出,Tairos 致力于为机器人本体与应用开发商补齐关键软件能力。
大厂 "all in AI" 时代,兴趣点日渐从模型层面向具身智能领域延伸。
同日发布的腾讯混元 3D 世界模型也有所暗示。早在去年底,混元 3D 生成大模型即已推出,到今年 4 月已迭代到 2.5 版本。此番 " 世界 " 二字融入产品名称,也提供了一种新的想象空间:腾讯混元或许在延伸出一条通往具身智能的 " 隐路 "。
3D 生成大模型总体有两条路。一条通往虚拟世界生成,主要应用于游戏、动漫、元宇宙等的艺术创作;一条通往现实世界仿真,供自动驾驶、具身智能训练。
目前,混元恰好站在从第一条路延伸向第二条路的衔接阶段。
腾讯混元 3D 负责人郭春超表示,混元 3D 的路线图是从 " 重建一个物体 ",到 " 生成一个场景 ",再到 " 理解一个世界 "。目前,腾讯还处在场景这一步,稳定的三维场景是一切的基础,也能够作为后续动作的载体。
据透露,其首要的目标是把三维资产生成做到更好的商用的水平。" 但确定的一点是,模型整体会朝着一个更完整、更能真实模拟物理规律的世界模型发展,我们今年会先重点起步,明年会逐步提升成熟度。" 他告诉雷峰网 AI 科技评论。
事实上,3D 生成的路线一直存在争议,主流呈现两大分支,一是基于纯 3D 的方式做空间构建,另一则基于纯 2D 也即视频模型构建。前者囿于 3D 场景数据匮乏,生成多样性不足;后者则因为缺乏三维空间约束,空间稳定性差。
在空间稳定性和多样性之间寻找中间路线,腾讯采用了 3D+2D 的方式。郭春超介绍,前景物体用 3D 方式构建,中景通过 2.5D 实现多视角补齐,远景则采取 2D 方式,因此整个模型采用的是一种分层的结合路线。
" 世界模型面临的主要问题——无论是对游戏制作还是具身训练——多样性不足。" 他进一步解释,因为 3D 动作序列资产稀缺,依赖纯粹 3D 会面临交互不自然,预测不准确,未来将加大在交互上的投入,加入更多 2D 生成的模型范式。