关于ZAKER Skills 合作
芯东西 1小时前

苏姿丰,投了只卖 AMD 算力的 AI 独角兽

估值至少达到 341 亿元。

编译 | ZeR0

编辑 | 漠影

芯东西 5 月 20 日消息,据《福布斯》昨日报道,美国 AI 模型开发商 Zyphra 正在进行5 亿美元(约合人民币 34 亿元)的新一轮融资,美国芯片巨头 AMD 也参与了投资。消息人士称,Zyphra 的估值将至少达到50 亿美元(约合人民币 341 亿元)

Zyphra 成立于 2020 年,开发先进的开源 AI 模型,并提供云基础设施服务。大多数 AI 实验室默认采用英伟达芯片,而 Zyphra 却完全站在 AMD 派系,其模型的训练和推理均在 AMD 硬件上运行,这既节省了成本,又带来了供应链优势。

Zyphra Cloud 是一个由 AMD 提供技术支持的全栈式新云平台,专为 AI 原生初创公司、企业和前沿 AI 超大规模数据中心而设计。

该平台最初基于 AMD MI355X GPU,支持领先的开源模型的无服务器推理,现已扩展到裸机 AMD 基础设施,提供两种主要部署模式:按需部署的裸机 GPU 集群,适用于灵活的工作负载;以及定制化的超大规模 AMD 基础设施,适用于大规模训练和推理部署。

目前,MI355 的 15 兆瓦容量已投入使用。

Zyphra Cloud 中,Zyphra Inference 推理云提供生产级模型服务,专为大型 MoE 模型和具有长上下文以及大型 KV 和 prefix cache 的长时间运行的代理工作负载而设计,由 MI355X GPU 和 TensorWave 合作提供支持,可处理包括 Kimi-K2.6、DeepSeek-V3.2、GLM-5.1 等先进开源模型。其模型服务价格如下:

昨日,Zyphra 预告将发布其基于 MI355X 的推理的首个端到端基准测试结果,并称其推理优化显著优于 AMD 基线,并缩小了 MI355X 和 B200 在运行 Kimi K2.6、GLM-5.1、DeepSeek-V3.2 等模型时的性能差距。

其优化包括:

树状注意力:用于长上下文注意力的平衡树状简化

TSP:在节点内部链路上保持模型并行组

跨内核、HIP 图、RCCL 进行调优

EAGLE 推测性解码针对 ROCm 进行了调整

更长的上下文时间能更好地发挥其优势。随着上下文时间的增加,TSP 和树状注意力机制能够带来更大的性能提升,从而缩小与 B200 的差距。在单请求解码和 TTFT 方面,B200 当前仍领先于 Zyphra 的技术栈和 AMD 基线,但 Zyphra 看到了缩小差距的途径。

Zyphra 解释了为什么选择 MI355X:每个 GPU 配备 288GB HBM3E,而 B200 则配备 180GB,这意味着更多的驻留 KV 和 prefix cache、更大的模型、更长的上下文,实现更低的延迟和更高的吞吐量。

相比 B200,MI355X 的单节点 HBM 内存预算在 GLM 5.1、DeepSeek-V3.2 和 DeepSeek-V4-Pro(即将推出)上大约翻了一番。

接下来,Zyphra 计划支持 DeepSeek-V4-Pro,扩展到 1.6T 参数和 1M 上下文、训练信息量化、基于扩散的推测器,以及服务引擎方面的工作。

该公司还计划将支持范围扩展至下一代 AMD 平台,包括 MI450 系列及后续产品。

来源:《福布斯》,Zyphra

相关阅读

最新评论

没有更多评论了
科技频道

科技频道

科技改变世界

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容