" 一旦 DeepSeek 率先在华为平台上发布,对美国而言将是灾难性的结果 "。
这里的 " 我国 " 指美国

作为大家苦等了一年多的 DeepSeek 大版本迭代,只看性能差友们可能会略有失望。但 DeepSeek V4 是真便宜,价格对比国外模型直接腰斩属于是。

但托尼觉得,随着这次发布,意义更重大的,是深度求索选择在华为昇腾平台上进行首发,结合下午的直播,这意味着 DeepSeek 完成了在国产硬件上的训练适配。

换句话说,从今天开始,大家嚷嚷了很久的 AI 全流程使用国产硬件,一下子就实现了!
大家可以把华为的昇腾平台理解为连 AI 芯片都是国产的 AI 计算平台。

但现在它就是成了,这对于国产 AI 的发展影响是很深远的。
之前老黄没少拿这个事儿游说美国政府 让自己卖货 ,按照老黄的意思,在 AI 军备竞赛中,从底层的电力,冷却,消防这些基础设施,到芯片、服务器等算力设施,再到软件生态和模型的架构演进,这些要素都缺一不可,样样都赢才能赢麻到最后。
AI 是一块 " 五层蛋糕 " - NVIDIA 博客 - 英伟达

但不得不承认,我们的芯片制程离世界顶端,确实有些差距。好在 AI 需要的芯片,打的是规模战、集群战。所以工程师们想了些办法,来解决制程上的不足。
一来,虽然制程工艺有限制,但芯片可以在不计成本的情况下,通过暴力堆规模,来提升算力。而在配套的内存上,国产也有自研 HBM(高带宽内存),来保证带宽没有瓶颈。


而国产芯片们想要堆出近似算力,就需要拿出更多的芯片。所以去年华为昇腾拿出了 384 超节点,通过 12 个机柜,每个机柜 32 张卡,硬是堆出 300 PFLOPs 算力,接近 NVL72 的两倍了。而今年差评更是在 MWC 现场看到了华为最新的 Atlas 950,也就是 8192 卡互联的超节点。

托尼不得不承认,老黄是真有远见的。20 年前,英伟达就开始为了 CUDA 生态埋伏笔,甚至牺牲掉了 GeForce 游戏显卡的利润,导致有一段时间差点在和 ATi/AMD 的竞争中死掉。
但英伟达成功熬到了黎明。所以差友们能看到,现在几乎所有 AI 相关的基础模型和优化都基于 CUDA 来运转、后起的 GPU、TPU 等 AI 计算生态都要向它低头。

也因此,对于国内来说,在制裁的大背景下,不论是华为昇腾的 CANN,还是摩尔线程的 MUSA,目前还要做对 CUDA 的兼容性支持,来让开发者能更快适应自家芯片。
但咱们也不能一直活在别人屋檐下。构建属于自己的软件生态,迫在眉睫。所以最近几年托尼也开始看到像 TileLang 这类由中国主导的生态项目,尝试在不同的方向构建出属于自己的护城河。

直到这次的 DeepSeek V4 更进一步,直接拒绝了英伟达和 AMD 的提前适配,而是选择华为昇腾和国产 CANN 软件生态。

托尼不得不感慨深度求索的这波操作:一方面是真的争气,另一方面,其实也是在把 DeepSeek 变成一个标杆,向其他国产大模型喊话:全国产链路已经跑通了,你们都可以来试试。
除此之外呢?还有什么理由让国产模型拥抱国产 AI 硬件生态吗?
最近一个月大家应该有感知,大模型的能力越来越强,强到已经不只是能对话的程度了。
前段时间 Anthropic 发布的 Mythos 模型,就号称 " 强到不敢直接发布 ",而是首先交给苹果、英伟达、微软等巨头,用来检测安全漏洞,加强网络防御。

不论如何,从硬件到软件,从模型到生态,全链路国产化,是必须要做的。这样才能真正不被英伟达等国外公司卡脖子。
当英伟达的 GPU 不再是唯一选择,当 CUDA 护城河不再牢固,当咱们的 AI 人才越来越多,生态越来越繁荣,产业界的底气自然也会越来越足。
回头看 DeepSeek V4 发布通告的结束语:不诱于誉,不恐于诽,率道而行,端然正己,这不仅是对国内 AI 公司应当脚踏实地的宣言,更是对国产 AI 硬件生态,这么多年一步一步走过来的肯定。

撰文:洛洛
编辑:米罗 & 面线 & 结界
美编:焕妍
图片、资料来源:
bilibili
英伟达官网
53ai.com
it 之家
昇腾 CANN


