关于ZAKER 合作
36氪 15小时前

智谱、阶跃、阿里大混战,大模型重回 2023

文|周鑫雨

编辑|苏建勋

沉寂许久的大模型竞技场,在这个夏天,又硝烟四起。

最近一场战役,发生在刚刚落幕的"AI 春晚 "WAIC(世界人工智能大会)期间。贴身对垒的三方,是六小虎中的阶跃星辰和智谱,以及大厂中的模型强队,阿里。

7 月 25 日,阶跃计划开源最新的多模态推理模型:Step-3。同一天,阿里又发布了全新的通义千问 3 推理模型。

28 日,智谱发布了最新一代基座大模型:GLM-4.5。而阿里的攻势不断——再次在同一天,阿里放出了多模态大礼包,开源了通义万相 2.2,涵盖文生视频、图生视频、统一视频生成三种模态。

其中颇有火药味的一幕是:7 月 25 日,最新的通义千问 3,还被阿里冠以 " 全球最强 " 之名;三天后,GLM-4.5 就以新王之姿成了全球开源模型的 "SOTA"(最强)——在智谱放出的综合性能榜单中,GLM-4.5 排全球第 3,通义千问 3 排第 9。

△智谱 GLM-4.5 在模型综合性能榜单排第 3。 图源:智谱

一名智谱员工告诉《智能涌现》,算法团队几乎所有人都守着通义千问的更新," 太紧张了。" 他说," 万一差距太大,我们后发就是个笑话。"直到 GLM-4.5 跑赢 Agentic 能力在内的多个测评集,他心中的石头才落地。

WAIC 上的硝烟,是这两个月以来六小虎模型混战的一个缩影。

早在 6 月,在为期 5 天的发布日中,MiniMax 开源的推理模型 M1,在上下文长度和工具使用场景中领跑了所有开源权重模型;视频生成模型 Hailuo 2,在海外创造了 " 小猫跳水 " 等爆款视频。

仅过了一个月,月之暗面的新开源基础模型 K2,又以横扫之势,拿下了 24 项开源模型 SOTA。

转型后的百川智能和零一万物,既缺席了 WAIC,也缺席了新一轮的模型混战。

智能涌现制图。

DeepSeek V3、R1 发布后,六小虎在市场上已经沉寂了近半年。

高管离职、人才出走,也已是常态。脉脉的一份报告显示,截至 2025 年 7 月初,六小虎中 41.07% 的员工都把状态设置成了 " 看机会 "。

后 DeepSeek 时代的战役,对六小虎能否回归舞台中央,甚至存亡,至关重要。这份成绩单,极大程度影响着公司后续的资本操作和商业化进展。

更重要的是,在市场口碑下滑、内部军心涣散的半年中,六小虎急需一场翻身仗,向内外证明自己仍有留在大模型牌桌上的底气。

但后 DeepSeek 时代的模型战役依然艰险。DeepSeek R1 的掀桌,证明了模型要想一鸣惊人,不仅性能要好,还得发得早。

被抢先的感觉,至今仍让不少小虎心悸——我们得知,K2 的训练从 2024 年末就开始筹备,也是月之暗面的自信之作,本计划在 2025 年中旬发布。然而,R1 的抢先发布,抢走了本可能属于 Kimi 的荣光。

为了防守,R1 发布的同一天,月之暗面不得不先释出带有遗憾的版本 K 1.5。最后的市场声量,不尽人意。

K2 发布后的好口碑,某种程度上也抚平了被 DeepSeek 抢先的创伤。发布当晚,月之暗面联合创始人张宇韬则在朋友圈写下:make kimi great again。

只是,K2 的先声夺人,让同样主打 Coding 和 Agentic 能力的智谱,也感受到了不甘。

我们了解到,为了打赢推理模型的 SOTA 之战,GLM-4.5 的训练已经花了将近 3 个月的时间。为了在多智能体任务上获得更好的表现,智谱甚至没有坚持一以贯之的 Dense(稠密)路线,而是改用了 MOE(混合专家模型)架构。

" 一开始 GLM-4.5 是想做国内第一个对标 Claude 4 的模型。" 有从业者告诉《智能涌现》," 可惜月暗的保密工作做得太好了,K2 发布当天才知道技术细节。"

智谱被月之暗面打了个措手不及,最后一个月紧急加训,硬是把 GLM-4.5 的 Coding 和 Agentic 能力,在测评集上拔高到了 " 小断 "K2 的程度,占住了六小虎最高的山头。

△ WAIC 上智谱的展台。图源:智能涌现拍摄

如今赛场上兵刃相接、针锋相对,也让这几家大模型公司像曾经的 2023 年一样,重回了舞台中心。

不过,与 2023 年行业 " 重参数、搞闭源 " 的普遍风气不同,如今的中国模型,已经把打响技术口碑给玩明白了。

自 DeepSeek 起势后,开源和放出技术报告,成了六小虎发模型的标配。

" 模型的第一批用户,肯定是开发者,如果没有抓住开发者,模型的声量是很难起来的。" 一名在 WAIC 上的 AI 应用开发者告诉我们。

他将开源,比做大模型触达开发者的门:" 现在找到开发者是很简单的,大家都聚集在 Hugging Face、GitHub 上,模型厂商要做的就是把开源链接发到上面。"

开源是门道,剩下的,就要交给技术实力。

即便经过了动荡的半年,但六小虎依然拥有远超普通创业公司的资金和人才储备。

可见的是,在这一轮模型混战中,六小虎都没有收获将彼此碾压的成绩,但各有各的亮点:

MiniMax 已经坐稳了视频生成的头部;

Kimi K2 和 GLM-4.5 先后狂揽模型 SOTA;

阶跃的 Step-3 则领跑了多模态这一尚且小众的赛道。

没有绝对的赢家,但经历这一轮模型混战后,六小虎在全球模型战场上,几乎都拥有了姓名。

模型开放平台 OpenRouter 的统计显示,2025 年 7 月 28 日,Kimi K2 位居全球模型调用量的第 6,而 GLM-4.5 在发布当天,就冲上了第 20 的位置。

MiniMax 发布 Hailuo 2 后,Hailuo AI 的下载量猛增——点点数据显示,Hailuo AI 7 月 22 日的单日下载量,达到了 11 万。

△ 2025 年 7 月 28 日,全球模型调用量排行榜。图源:OpenRouter

上岸的四小虎,获得了继续游戏的续命符。

连续 5 天发布包括 M1 在内的模型和产品后,MiniMax 传来了筹备 IPO 的消息。同样的,在阶跃发布会上,Step-3 发布后一锤定音的,是一笔来自上海国投等机构的超 5 亿美元融资,以及阶跃星辰 CEO 姜大昕口中,"10 亿元 " 的年营收目标。

不过,模型之战,还远未决出胜者。在以 " 中国不需要这么多的基座模型 " 为共识的前提下,六小虎在模型之战中,尚未走到可以安心的时刻。

角逐不仅发生在六小虎内部。WAIC 期间阿里的接连猛攻,已为六小虎敲响警钟——多模态、Coding、Agent,六小虎无法兼顾的几个模型方向,大厂却可以轻松 All in。

对剩余的四小虎而言,新一轮的淘汰赛才刚刚开始。

欢迎交流!

相关标签
36氪

36氪

让创业更简单

订阅

觉得文章不错,微信扫描分享好友

扫码分享