如今 AI 已经进入到全新的智能体 AI ( AI agent ) 阶段,也就是说 PC 从原来单个推理工具转变成了 AI 智能体中枢,从而对于 Token 的消耗量也是成倍提升,有巨头表示相比较单个推理,智能体 AI 对于 Token 的消耗将会提升 1000 倍,因此想要玩转智能体 AI 就需要强大的算力。

如今的智能体 AI 对于 PC 的要求达到了前所未有的程度,特别是许多特殊行业,更是需要将 AI 模型本地化运行,从而保证数据的低延迟与高隐私,我们看到许多基于 Strix Halo 处理器打造的 AI 工作站都拥有超大容量的内存。例如这一次 AMD 与合作伙伴所展示的一款 AI 工作站就搭载了 AMD 锐龙 AI MAX+ 395 处理器,其中的 Radeon 8060S 集显拥有 40 个 CU,算力远超传统内置显卡,已经和部分高端独立显卡不相上下,并且这款工作站也搭载了 128GB 的 LPDDR5X 内存,结合统一内存架构设计和 AMD 可变显存技术(VGM)最多分配 96GB 用作显存,从而轻松满足包括 AI 智能体在内的各种 AI 模型的本地化运行。

除了上述这些面向工作站以及消费级领域产品之外,AMD 也与合作伙伴一起展示了面向超大型 AI 模型训练的服务器产品,例如采用 AMD Instinct 计算卡打造的 AI 服务器就拥有 2U 规格,搭载双路霄龙 9004/9005 系列处理器,最高支持 12 通道的 24 条 DDR5 内存,并且也支持 4 路 PCIe GPU,还配备了 8 个 2.5 英寸的 U.2 SSD 插槽,这款服务器自然是为那些大中型企业所打造,能够高效地进行 AI 模型的训练,也为企业员工提供高效且安全的 AI 推理,同时借助先进的冷却系统减少能源的浪费,降低企业进行 AI 训练以及推理的成本。
