智谱、阶跃、阿里大混战，大模型重回 2023

文｜周鑫雨

编辑｜苏建勋

沉寂许久的大模型竞技场，在这个夏天，又硝烟四起。

最近一场战役，发生在刚刚落幕的"AI 春晚 "WAIC（世界人工智能大会）期间。贴身对垒的三方，是六小虎中的阶跃星辰和智谱，以及大厂中的模型强队，阿里。

7 月 25 日，阶跃计划开源最新的多模态推理模型：Step-3。同一天，阿里又发布了全新的通义千问 3 推理模型。

28 日，智谱发布了最新一代基座大模型：GLM-4.5。而阿里的攻势不断——再次在同一天，阿里放出了多模态大礼包，开源了通义万相 2.2，涵盖文生视频、图生视频、统一视频生成三种模态。

其中颇有火药味的一幕是：7 月 25 日，最新的通义千问 3，还被阿里冠以 " 全球最强 " 之名；三天后，GLM-4.5 就以新王之姿成了全球开源模型的 "SOTA"（最强）——在智谱放出的综合性能榜单中，GLM-4.5 排全球第 3，通义千问 3 排第 9。

△智谱 GLM-4.5 在模型综合性能榜单排第 3。图源：智谱

一名智谱员工告诉《智能涌现》，算法团队几乎所有人都守着通义千问的更新，" 太紧张了。" 他说，" 万一差距太大，我们后发就是个笑话。"直到 GLM-4.5 跑赢 Agentic 能力在内的多个测评集，他心中的石头才落地。

WAIC 上的硝烟，是这两个月以来六小虎模型混战的一个缩影。

早在 6 月，在为期 5 天的发布日中，MiniMax 开源的推理模型 M1，在上下文长度和工具使用场景中领跑了所有开源权重模型；视频生成模型 Hailuo 2，在海外创造了 " 小猫跳水 " 等爆款视频。

仅过了一个月，月之暗面的新开源基础模型 K2，又以横扫之势，拿下了 24 项开源模型 SOTA。

转型后的百川智能和零一万物，既缺席了 WAIC，也缺席了新一轮的模型混战。

智能涌现制图。

DeepSeek V3、R1 发布后，六小虎在市场上已经沉寂了近半年。

高管离职、人才出走，也已是常态。脉脉的一份报告显示，截至 2025 年 7 月初，六小虎中 41.07% 的员工都把状态设置成了 " 看机会 "。

后 DeepSeek 时代的战役，对六小虎能否回归舞台中央，甚至存亡，至关重要。这份成绩单，极大程度影响着公司后续的资本操作和商业化进展。

更重要的是，在市场口碑下滑、内部军心涣散的半年中，六小虎急需一场翻身仗，向内外证明自己仍有留在大模型牌桌上的底气。

但后 DeepSeek 时代的模型战役依然艰险。DeepSeek R1 的掀桌，证明了模型要想一鸣惊人，不仅性能要好，还得发得早。

被抢先的感觉，至今仍让不少小虎心悸——我们得知，K2 的训练从 2024 年末就开始筹备，也是月之暗面的自信之作，本计划在 2025 年中旬发布。然而，R1 的抢先发布，抢走了本可能属于 Kimi 的荣光。

为了防守，R1 发布的同一天，月之暗面不得不先释出带有遗憾的版本 K 1.5。最后的市场声量，不尽人意。

K2 发布后的好口碑，某种程度上也抚平了被 DeepSeek 抢先的创伤。发布当晚，月之暗面联合创始人张宇韬则在朋友圈写下：make kimi great again。

只是，K2 的先声夺人，让同样主打 Coding 和 Agentic 能力的智谱，也感受到了不甘。

我们了解到，为了打赢推理模型的 SOTA 之战，GLM-4.5 的训练已经花了将近 3 个月的时间。为了在多智能体任务上获得更好的表现，智谱甚至没有坚持一以贯之的 Dense（稠密）路线，而是改用了 MOE（混合专家模型）架构。

" 一开始 GLM-4.5 是想做国内第一个对标 Claude 4 的模型。" 有从业者告诉《智能涌现》，" 可惜月暗的保密工作做得太好了，K2 发布当天才知道技术细节。"

智谱被月之暗面打了个措手不及，最后一个月紧急加训，硬是把 GLM-4.5 的 Coding 和 Agentic 能力，在测评集上拔高到了 " 小断 "K2 的程度，占住了六小虎最高的山头。

△ WAIC 上智谱的展台。图源：智能涌现拍摄

如今赛场上兵刃相接、针锋相对，也让这几家大模型公司像曾经的 2023 年一样，重回了舞台中心。

不过，与 2023 年行业 " 重参数、搞闭源 " 的普遍风气不同，如今的中国模型，已经把打响技术口碑给玩明白了。

自 DeepSeek 起势后，开源和放出技术报告，成了六小虎发模型的标配。

" 模型的第一批用户，肯定是开发者，如果没有抓住开发者，模型的声量是很难起来的。" 一名在 WAIC 上的 AI 应用开发者告诉我们。

他将开源，比做大模型触达开发者的门：" 现在找到开发者是很简单的，大家都聚集在 Hugging Face、GitHub 上，模型厂商要做的就是把开源链接发到上面。"

开源是门道，剩下的，就要交给技术实力。

即便经过了动荡的半年，但六小虎依然拥有远超普通创业公司的资金和人才储备。

可见的是，在这一轮模型混战中，六小虎都没有收获将彼此碾压的成绩，但各有各的亮点：

MiniMax 已经坐稳了视频生成的头部；

Kimi K2 和 GLM-4.5 先后狂揽模型 SOTA；

阶跃的 Step-3 则领跑了多模态这一尚且小众的赛道。

没有绝对的赢家，但经历这一轮模型混战后，六小虎在全球模型战场上，几乎都拥有了姓名。

模型开放平台 OpenRouter 的统计显示，2025 年 7 月 28 日，Kimi K2 位居全球模型调用量的第 6，而 GLM-4.5 在发布当天，就冲上了第 20 的位置。

MiniMax 发布 Hailuo 2 后，Hailuo AI 的下载量猛增——点点数据显示，Hailuo AI 7 月 22 日的单日下载量，达到了 11 万。

△ 2025 年 7 月 28 日，全球模型调用量排行榜。图源：OpenRouter

上岸的四小虎，获得了继续游戏的续命符。

连续 5 天发布包括 M1 在内的模型和产品后，MiniMax 传来了筹备 IPO 的消息。同样的，在阶跃发布会上，Step-3 发布后一锤定音的，是一笔来自上海国投等机构的超 5 亿美元融资，以及阶跃星辰 CEO 姜大昕口中，"10 亿元 " 的年营收目标。

不过，模型之战，还远未决出胜者。在以 " 中国不需要这么多的基座模型 " 为共识的前提下，六小虎在模型之战中，尚未走到可以安心的时刻。

角逐不仅发生在六小虎内部。WAIC 期间阿里的接连猛攻，已为六小虎敲响警钟——多模态、Coding、Agent，六小虎无法兼顾的几个模型方向，大厂却可以轻松 All in。

对剩余的四小虎而言，新一轮的淘汰赛才刚刚开始。

欢迎交流！

产业资本领投，时驾科技完成亿元A轮融资，将建设50万套空悬产能

36氪 07-11

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频剪辑

AI视频剪辑

AI智能客服

AI工具箱

AI写稿助手

AI口语陪练

我的订阅

智谱、阶跃、阿里大混战，大模型重回 2023

宙世代

一起剪

相关阅读

产业资本领投，时驾科技完成亿元A轮融资，将建设50万套空悬产能

最新评论

36氪

热门推荐