关于ZAKER 合作
雷锋网 14小时前

阿里云推出自动驾驶模型训练推理加速框架,训练时间可缩短 50%

6 月 23 日消息,阿里云推出面向自动驾驶领域模型的训练、推理加速框架 PAI-TurboX,该框架可提升感知、规划控制乃至世界模型的训推效率,在多个行业模型的训练任务中,PAI-TurboX 均可缩短 50% 的时间。

目前,业界主流的自动驾驶方案需要融合图像、激光雷达、毫米波雷达、GPS 等多个模态数据,但大规模训练样本数据加载和预处理的效率较低,导致 GPU 资源浪费;同时,自动驾驶模型算子数量巨大,使用现有训推框架系统执行效率低下,且优化门槛高。

阿里云推出的 PAI-TurboX,在多模态数据预处理、离线大规模模型训练以及实时智驾推理等环节提供了全面解决方案。在系统侧,PAI-TurboX 通过优化 CPU 亲和性、动态编译、流水线并行等策略,显著提升模型的训练推理效率;在数据侧,PAI-TurboX 提出了高性能的 DataLoader 引擎,并且优化了数据预处理流程和实现了智能训练样本分组,有效提升数据处理效率。

此外,PAI-TurboX 还提供了算子优化和量化等能力,可进一步减少训练阶段的访存延迟,提升吞吐效率,同时在推理任务中,能在保障精度的同时降低计算开销与内存带宽需求,可实现异构平台下的高性能推理部署。

实测结果显示,在自动驾驶的 3D 物体检测模型 BEVFusion 训练任务中,PAI-TurboX 可以将训练时间缩短 58.5%;在实时在线矢量化高精地图构建模型 MapTR 训练任务中,PAI-TurboX 可以将训练时间缩短 53%;在端到端自动驾驶模型 SparseDrive 训练任务中,PAI-TurboX 可以在感知模块训练和联合训练两个阶段获得明显的速度提升,相同训练步数下可分别缩短 51.5% 和 48.5%。

阿里云研究员林伟表示:" TurboX 不仅可以提升自动驾驶模型的训推效率,还将进一步加速世界模型的开发进程,让所有终端和人一样具备感知、思考和决策能力。"

据介绍,阿里云人工智能平台 PAI 可提供贯穿 AI 开发和运维全流程的平台服务。自 2016 年诞生以来,PAI 已累计服务超过 10 万家企业客户及数百万 AI 开发者,支撑阿里云百炼、魔搭社区等 MaaS 服务及社区。

雷峰网

雷峰网

读懂智能&未来

订阅

觉得文章不错,微信扫描分享好友

扫码分享