关于ZAKER 合作
超能网 04-14

AMD 发布 ROCm 6.4 更新:带来了多项底层改进,但仍不支持 RDNA 4

AMD宣布,对 ROCm 软件栈进行了更新,推出了新的迭代版本 ROCm 6.4。这一新版本里,AMD 带来了多项底层改进,包括更新改进了 ROCm 的用户空间库和 AMDKFD 内核驱动程序之间的兼容性,使其更容易在更广泛的 Linux 内核上运行。可惜的是,这次仍然缺乏对 RDNA 4 架构 GPU 的支持。

AMD 还扩大了内部测试,以涵盖更多用户和内核版本的组合,这应该会减少高性能计算(HPC)和人工智能(AI)工作负载的集成问题。在框架方面,ROCm 6.4 现在支持 PyTorch 2.5/2.6 开箱即用,开发人员无需从源代码开始构建,就可以使用最新的深度学习功能。Megatron LM 集成增加了三个新的融合内核,包括 Attention ( QKV ) 、Layer Norm 和 ROPE,通过将多个操作合并到单个 GPU 通道中来加速训练。

视频解码也得到了提升,在 rocDecode 和 rocPyDecode 中都支持 VP9。同时现在已正式支持 Oracle Red Hat Enterprise Linux 9,Radeon PRO W7800 48GB 工作站显卡可在 ROCm 下进行验证。AMD 还在 NPS4 内存配置下启用了 CPX 模式,以满足 MI Instinct 系列加速器上的高级内存带宽需求。

AMD 已宣布将于太平洋时间 2025 年 6 月 12 日上午 9 点 30 分举行 "Advancing AI 2025" 活动,将讨论 AMD 对 AI 的愿景,带来下一代 Instinct 系列 GPU 和 AMD ROCm 开放软件生态系统的进展,届时可以了解到更多详尽信息。