关于ZAKER 合作
雷科技 12小时前

智元揽获 EAI-100 五项重磅大奖,技术与商用部署双领跑

3 月 22 日,在南京举办的 " 智汇金陵 · AI 开源人才峰会 " 上,魔搭社区联合 CCF 智能机器人专委会、工信部装备数字孪生技术重点实验室及 Lumina 具身智能社区等权威机构,正式发布了 EAI-100(Embodied Artificial Intelligence 100)具身智能年度百项代表性成果与人物榜单。智元(AGIBOT)凭借全栈技术创新与规模化产业落地成果,一举斩获 " 先锋人物 "" 年度 10 大突破 "" 年度 10 大数据集项目 " 及 " 年度 10 大落地典范 " 多项重磅荣誉,成为本届评选中获奖最多、覆盖维度最全面的企业,再度夯实其在具身智能赛道的领军地位。

EAI-100 具身智能年度百项代表性成果与人物榜单作为具身智能领域的权威风向标,旨在系统性呈现具身智能领域在先锋人物、学术新生代、技术突破等多个关键层面的代表性成果与核心力量。榜单评选重视真实影响、长期价值和方向性贡献,尤其关注研究范式、系统能力、产业实践等对中国具身智能发展的实质性推动。

在此次评选中,智元一举囊括五项 EAI-100 具身智能年度榜单,实现技术、人物、应用全维度突围:

智元合伙人、高级副总裁、具身业务部总裁姚卯青荣膺 "EAI Pioneer 20" 先锋人物。该榜单旨在表彰在具身智能领域产生持续且深远影响的领军人物,重点认可其在行业发展中所发挥的 " 开路者 " 作用。姚卯青以深厚学术积淀与产业经验,全面主导智元在数据基建、模型研发、产业化落地与开源生态建设的系统化布局,成为推动具身智能从实验室走向真实世界的核心推动者。

姚卯青(右四)荣膺 "EAI Pioneer 20" 先锋人物

1、通用具身基座模型 GO-1:全球首个采用 Vision-Language-Latent-Action(ViLLA)架构的通用具身智能模型,由多模态大模型、隐式规划器与动作专家协同构成,成功弥合图像 - 文本输入与机器人执行动作之间的语义鸿沟。模型具备优秀跨本体迁移能力,在主流仿真平台与真机实验中均取得领先性能,已向全球开发者免费开放,极大降低行业技术门槛,加速具身智能普及。

2、SOP 在线后训练系统:业界首个面向真实世界部署的 VLA 分布式在线后训练底座,构建 " 在线、集群、并行 " 低延迟数据闭环体系。仅需 3 小时在轨经验即可实现约 30% 性能跃升,多任务通才成功率突破 94%,四机集群训练速度达单机 2.4 倍,为具身模型规模化量产与持续迭代提供工业级解决方案。

AgiBot World 数据集是全球首个覆盖全域真实场景、采用全能硬件平台并具备全流程质量把控的百万级真实机器人数据集。该数据集面向机器人日常生活能力训练,数据由 100 台移动双臂机器人在 4000㎡真实场地中采集完成,场景包括家居、餐饮、工业、商超、办公五大类,涉及 3000+ 种真实物品,被誉为具身智能领域的 "ImageNet 时刻 "。

智元工业产线强化学习落地是全球首个将强化学习具身算法规模落地于真实工业场景的机器人系统,聚焦 3C 产线电检与装配核心环节,通过强化学习算法持续优化作业流程,实现作业成功率 100%,大幅提升了 3C 产线的生产效率与产品合格率。

此次斩获多项殊荣,是行业与权威机构对智元在具身智能领域长期布局、技术攻坚与产业落地成果的认可,更是对其推动行业进步、指引未来趋势的高度肯定。

峰会现场,姚卯青以 " 具身智能赋能新质生产力 " 为题发表主题演讲,系统阐述了智元在全链条技术布局与产业落地方面的思考与实践。

" 具身智能想要真正走进实际场景、落地部署并赋能客户,是一项极具挑战性的系统工程,必须打通硬件、数据、模型、场景全链条闭环。" 姚卯青直言,作为深耕具身智能领域的创新企业,智元构建起从本体研发到场景应用的完整布局,2024 年打造国内首个 3000 平米机器人数据采集场地,采集海量行业数据并开源;依托数据积累,自主研发 VLA 与世界模型等多款通用具身模型,推出覆盖全流程的一站式开发者平台,为具身智能产业化筑牢技术根基。

直面数据瓶颈这一行业核心痛点,姚卯青指出:" 语言模型可获取数百万亿 tokens 的训练数据,但具身智能的训练数据量,与之存在 4 到 5 个数量级的差距。" 为此,智元率先启动真机数据采集,并于 2024 年 12 月开源全球首个基于全域真实场景的百万真机数据集 AGIBOT World,该数据集迅速成为全球下载量最高的开源真机数据集,被英伟达等全球领军企业广泛采用。目前智元持续拓展数据维度,同步布局真机实操、人机交互、物理场景等多类数据采集,今年预计产出数百万小时高质量有效数据,以优质数据夯实模型训练基础。

同时,为解决落地成本难题,智元构建了仿真全生命周期流程," 近 90% 的研发工作在仿真环境中提前搭建、验证并跑通,仅剩余 10% 的场景适配与落地调试工作。" 姚卯青表示,智元利用生成式 AI 实现小时级场景构建,大幅缩短了从实验室到工厂的 " 最后一公里 "。

围绕核心技术突破,智元构建了 " 数据—预训练—后训练—世界模型 " 全链路闭环体系,打造可持续进化的具身智能模型。姚卯青介绍,在预训练层面,智元推出全国首个通用具身基座模型 GO-1,开创性提出 ViLLA 架构,通过 VLM 与 MOE 的融合实现通用感知与动作能力及跨任务泛化,让机器人既能从人类视角学习动作规律,又能掌握物理世界交互逻辑。

而在世界模型领域,姚卯青则强调,"世界模型是我们坚定投入的方向,早在 2024 年,智元就认准这一技术赛道。相较于语言模型偏向抽象逻辑思维表征,世界模型是从 3D 物理世界中学习规律,更适配具身智能场景需求。" 去年 7 月,智元发布世界模型平台 Genie Envisioner,这是行业内首次构建的 4D 具身世界模型及基准数据集 EWMBench。该模型统一了世界动作模型与仿真器,实现了从环境理解、动作推理到仿真训练的全链路能力。

依托全栈技术突破,智元机器人已实现规模化产业落地,赋能新质生产力发展。姚卯青介绍," 我们的机器人已在 3C 制造领域实现零部件精准检测与上下料作业,在泛工业场景完成吊箱拆卸与转运,在汽车零部件领域实现自动化上下料,在物流场景完成包裹分拣与拆解。"目前相关技术方案已在真实工业现场实现 24 小时连续不间断作业,产线效率(UPH)达到人类同等作业水平,平均无故障时间(MTBF)达百小时级别。

从数据采集、模型训练到场景落地,一套成熟的具身智能体系,需要稳定可靠的硬件本体与 VLA、强化学习、世界模型等核心技术的深度融合。姚卯青表示," 面向未来,智元将持续深化技术迭代与生态共建,让我们的技术体系、数据模型与场景适配能力不断迈上新台阶。这一战略路径,正是具身智能赋能新质生产力的生动实践。"

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容