关于ZAKER 合作
热点微评 13小时前

DeepSeek 抛弃英伟达,华为给出第二选择,中国 AI 迎来“安卓时刻”

在小说阅读器读本章

去阅读

文 / 王新喜

2026 年 4 月 7 日,中国 AI 圈炸了。全球顶级大模型 DeepSeek 官方宣布:DeepSeek 下一代旗舰模型 V4 将完全运行于华为昇腾 950PR 芯片,技术架构从 CUDA 全面转向 CANN 框架。

而最新消息,DeepSeek 创始人梁文锋近日在内部沟通中透露,DeepSeekV4 将于 4 月下旬发布,中国 AI 产业在去 "CUDA 化 " 路上迈出关键一步。

deepseek V4 跟国产 AI 芯片的适配,这将使得 deepseek 成为国内首个在推理阶段彻底摆脱英伟达算力依赖的万亿级参数大模型。

回到 2025 年初,DeepSeek 以低成本训练的 V3 和 R1 模型震动全球,其极低的开发成本与接近甚至 OpenAI 的性能表现,打破了 " 算力决定一切 " 的固有认知,为全球 AI 发展提供了新思路,这引发美股科技板块大幅抛售,市场开始重新评估英伟达等 AI 算力基础设施公司的估值逻辑。

但那一轮冲击背后,DeepSeek 使用的算力硬件仍然相当程度上依赖英伟达的芯片,包括出口限制相对宽松的 H800 型号。

随后,美国进一步收紧出口管制,英伟达最顶级的 H100、H200,B200 全部禁用,后来连英伟达的 H20 芯片也被禁止向中国出售。

这实质上切断了中国 AI 公司通过 " 降规格版本 " 获取高性能算力的渠道。DeepSeek 已经用算法优化把有限算力的性能压榨到了极致——他们早期用 " 混合专家 " 架构,把模型推理成本砍掉了 90%,震惊了全球。

DeepSeek 需要的不是更好的芯片,而是有自主可控的芯片可用。如今,华为已经满足了 DeepSeek 的诉求。

2026 年 4 月 6 日,据 The Information 等媒体爆料,DeepSeek 下一代旗舰模型 V4 已全面迁移至华为昇腾 950PR,底层代码从 CUDA 重写为 CANN 框架。

按照行业惯例,新模型发布前通常会提前数月向芯片厂商开放测试权限,进行针对性性能优化。但 DeepSeek 这次选择了完全不同的路径:他们直接拒绝了英伟达的早期访问请求,反而把模型优先开放给华为和寒武纪等国产芯片厂商。

这种做法在 AI 圈几乎是反着来,信号却再明确不过:V4 从一开始就是为国产算力量身定制,英伟达被排除在外,要彻底摆脱对美国芯片的依赖。

华为昇腾 950PR 芯片早在 2026 年 3 月 21 日就正式发布,并配套华为自研的 Atlas 350 加速卡方案。

根据华为公开的技术规格和第三方机构 Digitimes 的评测,Ascend 950PR 的算力性能接近被禁英伟达 H20 芯片的三倍,多模态生成速度快 60%,自研 HBM 容量达 112GB,算力利用率从行业平均 60% 提升至 85% 以上,部署成本降至英伟达方案的 1/3。

值得一提的是,华为昇腾 950PR 芯片配套华为自研的 Atlas 350 加速卡方案。这张加速卡,使用的是全新昇腾 950PR(Ascend 950PR)处理器。其性能方面,Atlas 350 的单卡算力达到了英伟达 H20 的 2.87 倍,更是国内唯一支持 FP4 低精度的推理产品。

FP4 是一种 " 用精度换效率 " 的技术,能让大型 AI 模型在更少的显存中运行。原本需要 4 张加速卡才能支撑的 700 亿参数模型,现在 1 张卡即可轻松容纳。以 700 亿参数的大模型为例,原本需要 140GB 显存,使用 FP4 后仅需 35GB 就能流畅运行。

这意味着在相同的硬件条件下,可以部署更大规模的模型,或者支持更多的并发推理请求。

在当前 "Token 通胀 " 的时代背景下—— OpenClaw 的 Token 消耗量一个月内从 806 亿飙升至 3580 亿,增长了约 3.4 倍—— FP4 带来的效率提升,直接转化为成本优势。

华为计划 2026 年全年出货约 75 万颗该型号芯片,并已于今年 1 月开始向字节、阿里等主要客户发送样品测试。这么多合作伙伴支持,意味着这不只是一次技术升级,更是一次战略性的 " 换芯手术 ",国内一众厂商是真的有意识选择另外一个生态圈了。

DeepSeek V4 与华为 Ascend 950PR 的组合,也将成为国产算力能否支撑顶级前沿模型训练的一次真实检验。

给世界第二个选择,AI 大模型生态迎来 iOS 与安卓之争

因为美国出口管制,英伟达的高端芯片对中国市场的供应一直在收紧,DeepSeek 是被现实逼出来的生存选择——谁手里有自主可控的芯片,谁就能第一时间通过自家云服务把模型跑起来,集成进 AI 应用里,不用看任何人的脸色,不用怕任何突如其来的管制。

DeepSeek 尽管训练端仍依赖英伟达(华为训练芯片 950DT 预计 Q4 上市),软件生态也需完善,但 " 昇腾 +DeepSeek" 组合已为国产 AI 开辟了成本可控、安全自主的新路径。据知情人士说,在 V4 训练和推理上,昇腾 950PR 的表现达到了预期,否则 DeepSeek 不会拍板全面迁移。

国产 AI 产业正从 " 被迫适应 " 到 " 主动选择 " 的历史性转变,这个信号会带动一批人跟进,整个国产芯片的软件生态就能慢慢活起来。

DeepSeek 带头做模型原生适配,华为做芯片和底层框架,国内大厂拿订单铺场景,中国 AI 有望第一次形成 " 上游芯片 - 中游模型 - 下游应用 " 全链条的完整闭环。从硬件到软件,从训练到落地,全流程都握在自己手里。

而更大的意义,还在于给出世界第二个选择。在去年,DeepSeek 横空出世通过技术优势在世界舞台上大放光芒,通过开源策略与低价 API 服务,推动全球开发者生态建设,DeepSeek 是全球被引用最多的开源 AI 模型之一,有大量开发者在用它的代码和框架。

如果 V4 在昇腾上跑起来效果好,可能会在全球范围内吸引开发者顺着这条路,开始认真评估昇腾方案。

以前,搞 AI 大模型,基本绕不开英伟达的芯片与 CUDA 生态,现在华为昇腾 +CANN 的出现,全世界的客户有了第二选项,这意味着所有鸡蛋不用放在一个篮子里了。当年安卓替代塞班,不是因为安卓更先进,是因为给了整个行业另一个选择。

DeepSeek V4 接入了华为芯片,它其实就是中国 AI 行业的 " 安卓时刻 ",一旦在中国打开局面,或将风靡全球,包括欧洲、东南亚的一些国家和企业,都有了一个性能同样强大的 AI 生态备选项。

原来围着英伟达的 CUDA 转的圈子,会慢慢被华为的昇腾生态吸附过来,未来的 AI 竞争,也将形成两大生态之争,这就像全球手机市场生态系统之争,逐步形成苹果 iOS 和谷歌安卓生态,形成双雄竞争的格局,以后 AI 芯片与算力的竞争,也将变成两大生态的竞争。

相比英伟达方案,华为芯片加 V4 组合,硬件采购成本降低 40%,推理成本降低 60%,而且在美国芯片出口管制下,国产芯片与国产模型组合能实现全链路自主可控。

也就是说,在 AI 硬件成本与供应链安全可控层面,中国的 AI 路线反而有自己的优势。这对应了东南亚、欧洲等一些国家追求降本增效,且避免被美国未来出口管制掣肘的风险。

因此,这一次 DeepSeek 与华为的双向奔赴的结果如何,不仅关系到 DeepSeek 一家公司的技术路线,也将在相当程度上决定整个中国 AI 产业的发展以及市场客户对国产芯片的信心走向。

今天的昇腾与英伟达的差距客观存在,但这是一场持久战,关键意义在于,今天这扇门被真正推开了一条缝,接下来就能越开越大。

中国 AI 在未来 3~5 年实现算力自主,这种 " 应用生态突围 + 硬件换道 " 的组合拳,可能有望进一步打破算力囚牢困境,并且有望通过这条路线的成功,在全球市场打开新的局面,中美 AI 两大生态的较量将拉开序幕,我们拭目以待。

相关标签

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容