近日,DeepSeek V4 正式发布,面向长文档理解、代码生成、复杂任务规划、企业级知识库和行业智能体等场景,对底层 AI 算力、推理框架、显存调度、多卡并行、KV Cache 管理以及算子优化能力提出了更高的 " 芯模协同 " 要求。华为同步宣布昇腾超节点全系列产品全面支持 DeepSeek V4 系列模型,昇腾 CANN 生态通过高性能融合算子、框架异步调度、MTP 多步投机、长上下文管理等优化技术,为 DeepSeek V4 原生 1M 长上下文提供高性能推理支撑。
作为昇腾钻石级伙伴,卡莱特已率先在昇腾 Atlas 800 A3 超节点平台完成 DeepSeek V4 的部署和调度。面向 MoE 大模型及超长上下文推理场景,卡莱特自主研发的算力调度平台能够实现跨卡、跨节点的系统级算力调度与任务管理,具备基于 Atlas 800 A3 超节点的大模型算力调度能力。该能力已在全球首个面向科研教育领域的华为 384 超节点项目中完成部署,为国产大模型在超大规模算力集群上的稳定运行积累了实战经验。
围绕 DeepSeek V4 等国产大模型的规模化应用,卡莱特正在构建完整的 AI 推理产品矩阵,提供从 AI 推理模组、推理卡、多卡推理服务器到超节点调度平台,再到行业智能体一体机的全栈产品体系,覆盖从边缘推理、私有化部署到大规模算力集群调度的全场景需求。
大模型产业正从 " 参数竞争 " 转向 " 工程化落地竞争 "。对行业客户而言,真正有价值的不是模型本身,而是模型能否在客户现场稳定运行、能否接入业务系统、能否保障数据安全、能否实现持续优化,并最终形成可交付、可复制、可规模化推广的行业产品。
卡莱特携手华为生态,发挥自身在超节点算力调度、算子优化与模型适配能力,以及公司在显示控制、边缘设备、AI 硬件产品化和行业应用方面的积累,持续推进 DeepSeek、Qwen、GLM、Minimax 等国产大模型在政企、教育、会议、安全、显示控制等场景中的落地应用。
未来,卡莱特将继续以华为生态为基础,聚焦 " 国产大模型 + 国产 AI 算力 + 行业产品化落地 " 持续投入,打造完整的产品体系,帮助客户构建安全、可控、高效的国产 AI 基础设施,让国产大模型真正进入千行百业的现场。
。
( 卡莱特 动态宝 )