6 月 23 日消息,阿里云推出面向自动驾驶领域模型的训练、推理加速框架 PAI-TurboX,该框架可提升感知、规划控制乃至世界模型的训推效率,在多个行业模型的训练任务中,PAI-TurboX 均可缩短 50% 的时间。
阿里云推出的 PAI-TurboX,在多模态数据预处理、离线大规模模型训练以及实时智驾推理等环节提供了全面解决方案。在系统侧,PAI-TurboX 通过优化 CPU 亲和性、动态编译、流水线并行等策略,显著提升模型的训练推理效率;在数据侧,PAI-TurboX 提出了高性能的 DataLoader 引擎,并且优化了数据预处理流程和实现了智能训练样本分组,有效提升数据处理效率。
此外,PAI-TurboX 还提供了算子优化和量化等能力,可进一步减少训练阶段的访存延迟,提升吞吐效率,同时在推理任务中,能在保障精度的同时降低计算开销与内存带宽需求,可实现异构平台下的高性能推理部署。
实测结果显示,在自动驾驶的 3D 物体检测模型 BEVFusion 训练任务中,PAI-TurboX 可以将训练时间缩短 58.5%;在实时在线矢量化高精地图构建模型 MapTR 训练任务中,PAI-TurboX 可以将训练时间缩短 53%;在端到端自动驾驶模型 SparseDrive 训练任务中,PAI-TurboX 可以在感知模块训练和联合训练两个阶段获得明显的速度提升,相同训练步数下可分别缩短 51.5% 和 48.5%。
据介绍,阿里云人工智能平台 PAI 可提供贯穿 AI 开发和运维全流程的平台服务。自 2016 年诞生以来,PAI 已累计服务超过 10 万家企业客户及数百万 AI 开发者,支撑阿里云百炼、魔搭社区等 MaaS 服务及社区。