来源:新浪科技
新浪科技讯 6 月 16 日下午消息,阿里巴巴发布千问具身智能大模型 Qwen-Robot 系列,包含 VLA 操作模型 Qwen-RobotManip、VLN 移动模型 Qwen-RobotNav 和世界模型 Qwen-RobotWorld 三大模型。这三个模型分别为机器人装上灵巧的手、认路的脚和会思考的大脑,既可单独部署,也能协同运转。

如果说 VLA 模型让机器人能动手,那么 VLN(Vision-Language Navigation,视觉语言导航)模型,就是让机器人能认路、会跑腿。Qwen-RobotNav 基于 Qwen-VL 构建,将语言指令导航、目标搜索、自动驾驶等五大任务族统一到同一个框架,遇到复杂任务无需人工切换模型。
Qwen-RobotWorld 则基于对物理规律的理解,可推理和模拟出下一个时间点机器人的合理动作和状态,让机器人在现实世界中可按图索骥般地行动。(文猛)