关于ZAKER 合作
智东西 8分钟前

刚刚,阿里 AI 芯片“真武 810E ”来了!已实现多个万卡集群部署

芯东西(公众号:aichip001)

作者 | ZeR0

编辑 | 漠影

芯东西 1 月 29 日报道,今日,阿里巴巴集团全资半导体芯片业务主体平头哥官网上线高端 AI 训推一体芯片真武 810E

这就是此前被央视《新闻联播》曝光的阿里自研芯片 PPU。据悉," 真武 "PPU 已在阿里云实现多个万卡集群部署,服务了国家电网、中科院、小鹏汽车、新浪微博400 多家客户。(阿里自研 AI 芯片曝光!

至此,由通义实验室、阿里云、平头哥组成的阿里巴巴 AI 黄金三角 "通云哥" 首次浮出水面。

平头哥成立于 2018 年 11 月,注册地址在上海,已推出AI 推理芯片含光 800训推一体 AI 加速芯片真武 810EArm 服务器 CPU 倚天 710高性能SSD 主控芯片镇岳 510超高频 RFID 电子标签芯片羽阵 611羽阵 600等芯片,并不断丰富产品线。

真武 810E 采用自研并行计算架构ICN 片间互联技术,单卡采用96GB HBM2e内存,支持7 个独立 ICN 链路,片间互联带宽达到700GB/s,可灵活配置多卡组合,应用于 AI 训练、AI 推理和自动驾驶,已在阿里云实现多个万卡集群部署

阿里巴巴已将 " 真武 "PPU 大规模用于千问大模型的训练和推理,并结合阿里云完整的 AI 软件栈进行深度优化,为客户提供一体化产品和服务。

据业内人士透露,对比关键参数," 真武 "PPU 的整体性能超过英伟达 A800 和主流国产 GPU与英伟达 H20 相当

另据外媒最新报道,升级版 " 真武 "PPU 的性能强于英伟达 A100

多位行业从业者称," 真武 "PPU 性能具有优异稳定、性价比突出等特点,在业内口碑良好。

阿里巴巴正在将 "通云哥" 打造成一台AI 超级计算机,它同时拥有全栈自研芯片的平头哥、亚太第一的阿里云,以及在全球享有盛誉的开源模型 " 千问 ",可在芯片架构、云平台架构和模型架构上协同创新,从而实现在阿里云上训练和调用大模型时达到最高效率。

平头哥官网列出了真武 810E 的六大优势:全自研、高性能、强互联、高易用、规模验证、芯云一体

ICN(Inter-Chip-Network)是平头哥自研的片间互联技术,具有高性能、高带宽、低延迟优势,适用于大模型训练和推理应用。

每颗真武 810E 芯片配备 7 个 ICN 片间互联端口,配合平头哥自研互联加速库,实现多卡协同工作,从而高效支持大模型训练及推理需求。

平头哥自主研发的 AI 产品软件栈,具备完备的软件生态及工具链,拥有独立知识产权,具备统一的编程接口,可端到端支持用户自主业务落地和扩展,向上支持开发者和业务快速展开,向下兼容底层硬件和优化性能,实现软硬件高效协同。

(1)高效性:通过软件栈提供的 API,用户可以基于 SDK 直接开发真武应用程序,支持自研生态;

(2)高兼容性:沿用当今主流编程环境,开发者可调用软件栈中统一的 API,支持主流 AI 生态,无需修改应用代码。

官网列出了真武 910E 的四大应用场景

(1)自动驾驶:经过验证兼容超过50 个自动驾驶常见模型,在感知、预测和端到端等多种模型架构下,全面支持智驾模型训推,并已形成多个万卡级别集群的部署应用

(2)AI 训练:原生支持多种框架,具有高速片间互联和优异的集群线性加速比,兼容主流 AI 生态,提供高性能、高易用的训练算力。

(3)AI 推理:原生支持主流推理引擎,并提供平头哥自研专用推理框架和算子库,结合大容量内存,为大模型推理提供针对性优化。

(4)多模态模型:在文生视频、图文生视频、图文生文等场景的推理和训练实测中均表现出不俗的性能,为基于多模态模型的应用场景提供高性价比算力

阿里巴巴 2009 年创建阿里云,2018 年成立平头哥芯片公司,2019 年启动大模型研究,经过长达 17 年的战略投入和垂直整合,实现 " 通云哥 " 全栈 AI 的完整布局。

官网显示,平头哥致力于 AI 时代的芯片基础设施创新,打造数据中心算力、存力、网力芯片和 IoT 芯片, 通过端云一体全栈产品系列为数字化、智能化时代提供无处不在的普惠算力。

该公司重点布局高性能、高性价比的自研数据中心芯片,提升数据中心能力和效率,通过软硬一体解决方案,加速新一代数据中心的规模化部署,促进 AI 从数字世界向物理世界的渗透。

芯东西(公众号:aichip001)

作者 | ZeR0

编辑 | 漠影

芯东西 1 月 29 日报道,今日,阿里巴巴集团全资半导体芯片业务主体平头哥官网上线高端 AI 训推一体芯片真武 810E

这就是此前被央视《新闻联播》曝光的阿里自研芯片 PPU。据悉," 真武 "PPU 已在阿里云实现多个万卡集群部署,服务了国家电网、中科院、小鹏汽车、新浪微博400 多家客户。(阿里自研 AI 芯片曝光!

至此,由通义实验室、阿里云、平头哥组成的阿里巴巴 AI 黄金三角 "通云哥" 首次浮出水面。

平头哥成立于 2018 年 11 月,注册地址在上海,已推出AI 推理芯片含光 800训推一体 AI 加速芯片真武 810EArm 服务器 CPU 倚天 710高性能SSD 主控芯片镇岳 510超高频 RFID 电子标签芯片羽阵 611羽阵 600等芯片,并不断丰富产品线。

真武 810E 采用自研并行计算架构ICN 片间互联技术,单卡采用96GB HBM2e内存,支持7 个独立 ICN 链路,片间互联带宽达到700GB/s,可灵活配置多卡组合,应用于 AI 训练、AI 推理和自动驾驶,已在阿里云实现多个万卡集群部署

阿里巴巴已将 " 真武 "PPU 大规模用于千问大模型的训练和推理,并结合阿里云完整的 AI 软件栈进行深度优化,为客户提供一体化产品和服务。

据业内人士透露,对比关键参数," 真武 "PPU 的整体性能超过英伟达 A800 和主流国产 GPU与英伟达 H20 相当

另据外媒最新报道,升级版 " 真武 "PPU 的性能强于英伟达 A100

多位行业从业者称," 真武 "PPU 性能具有优异稳定、性价比突出等特点,在业内口碑良好。

阿里巴巴正在将 "通云哥" 打造成一台AI 超级计算机,它同时拥有全栈自研芯片的平头哥、亚太第一的阿里云,以及在全球享有盛誉的开源模型 " 千问 ",可在芯片架构、云平台架构和模型架构上协同创新,从而实现在阿里云上训练和调用大模型时达到最高效率。

平头哥官网列出了真武 810E 的六大优势:全自研、高性能、强互联、高易用、规模验证、芯云一体

ICN(Inter-Chip-Network)是平头哥自研的片间互联技术,具有高性能、高带宽、低延迟优势,适用于大模型训练和推理应用。

每颗真武 810E 芯片配备 7 个 ICN 片间互联端口,配合平头哥自研互联加速库,实现多卡协同工作,从而高效支持大模型训练及推理需求。

平头哥自主研发的 AI 产品软件栈,具备完备的软件生态及工具链,拥有独立知识产权,具备统一的编程接口,可端到端支持用户自主业务落地和扩展,向上支持开发者和业务快速展开,向下兼容底层硬件和优化性能,实现软硬件高效协同。

(1)高效性:通过软件栈提供的 API,用户可以基于 SDK 直接开发真武应用程序,支持自研生态;

(2)高兼容性:沿用当今主流编程环境,开发者可调用软件栈中统一的 API,支持主流 AI 生态,无需修改应用代码。

官网列出了真武 910E 的四大应用场景

(1)自动驾驶:经过验证兼容超过50 个自动驾驶常见模型,在感知、预测和端到端等多种模型架构下,全面支持智驾模型训推,并已形成多个万卡级别集群的部署应用

(2)AI 训练:原生支持多种框架,具有高速片间互联和优异的集群线性加速比,兼容主流 AI 生态,提供高性能、高易用的训练算力。

(3)AI 推理:原生支持主流推理引擎,并提供平头哥自研专用推理框架和算子库,结合大容量内存,为大模型推理提供针对性优化。

(4)多模态模型:在文生视频、图文生视频、图文生文等场景的推理和训练实测中均表现出不俗的性能,为基于多模态模型的应用场景提供高性价比算力

阿里巴巴 2009 年创建阿里云,2018 年成立平头哥芯片公司,2019 年启动大模型研究,经过长达 17 年的战略投入和垂直整合,实现 " 通云哥 " 全栈 AI 的完整布局。

官网显示,平头哥致力于 AI 时代的芯片基础设施创新,打造数据中心算力、存力、网力芯片和 IoT 芯片, 通过端云一体全栈产品系列为数字化、智能化时代提供无处不在的普惠算力。

该公司重点布局高性能、高性价比的自研数据中心芯片,提升数据中心能力和效率,通过软硬一体解决方案,加速新一代数据中心的规模化部署,促进 AI 从数字世界向物理世界的渗透。