关于ZAKER 合作
每日经济新闻 17小时前

深夜突袭!万亿参数 MoE 模型 Kimi K2 上线即开源,月之暗面能否重归 C 位?

2025 年以来略显沉寂的月之暗面,在深夜突袭。

7 月 11 日晚,月之暗面宣布正式发布 Kimi K2 模型,并同步开源。从介绍来看,Kimi K2 是一款具备更强代码能力、更擅长通用 Agent(智能体)任务的 MoE(Mixture of Experts,混合专家模型)架构基础模型,总参数 1T,激活参数为 32B。

本次开源的 Kimi K2 模型分为 Kimi-K2-Base 和 Kimi-K2-Instruct 两个版本,前者是未经过指令微调的基础预训练模型,适合科研与自定义场景;而后者为通用指令微调版本(非思考模型),在大多数问答与 Agent 任务中有更好的表现。

2025 年以来,"Kimi 们 " 的处境正发生着改变。DeepSeek 以低成本、高性能的开源模型强势入场;MinMax 更是火力全开,今年 6 月在向开源社区投下一枚 " 重磅炸弹 ",发布自主研发的 MiniMax-M1 系列模型后,在紧随其后的四个工作日里 " 一日一更 ",直接 " 五连发 ";而一众大厂对于 AI(人工智能)热情和野心也在今年再上一个台阶,阿里、腾讯持续加码 AI,字节来势汹汹,大模型格局的洗牌还在继续。

抛开一切变化,硬实力才是搏击市场的硬拳头。这次,月之暗面能否靠 Kimi K2 重归大模型 C 位?

Kimi K2 上线即开源

月之暗面在官方介绍中称,在 SWE Bench Verified、Tau2、AceBench 等基准性能测试中,Kimi K2 均取得开源模型中的 SOTA(state-of-the-art)成绩。在其公布的测评结果中,Kimi K2 在 Agentic Coding(自主编程)、Tool Use(工具调用)和 Math&Reasoning(数学推理)三个维度的表现上均超过了同为开源模型的 DeepSeek-V3 和阿里 Qwen3。值得一提的是,Kimi 评测中的所有模型均为非思考模型的 Kimi-K2-Instruct。

目前,Kimi K2 的 API(应用程序编程接口)服务已上线,支持最长 128K 上下文,计费方案为 4 元 / 百万 " 输入 "tokens(大模型处理文本时的最小单位),16 元 / 百万 " 输出 "tokens,兼容 OpenAI 和 Anthropic 两种 API 格式。

为了体现 Kimi K2 在代码、Agent 工具调用、风格化写作三项能力上的提升,月之暗面也给出了具体任务下的展示。在前端开发任务中,Kimi K2 支持粒子系统、可视化和 3D(三维)场景等表现形式。

Kimi K2 生成的山川峡谷 3D 景观 图片来源:月之暗面 Kimi 官方公众号截图

而在 Agent 工具调用能力方面,月之暗面表示 Kimi K2 现已具备稳定的复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的 ToolCall(工具调用)结构。在其释出的案例中,Kimi K2 规划了参加 Coldplay 乐队巡演的行程,可以完成演唱会所在城市的机酒与旅游规划,并且生成日历,再用 html 概括完整行程规划。

《每日经济新闻》记者也使用 Kimi K2 进行了旅游规划的测试。根据 " 两个人计划 8 月份从北京出发,去日本东京以及大阪进行为期 5 天的旅游,希望能看到花火大会、吃到当地特色食物,帮我做一下包括机酒和行程在内的图文并茂的旅行规划 " 的需求,Kimi K2 花费 3 分钟左右进行了一份详尽的旅游规划,规划中包括了具体的餐厅、食物、景点以及一些实用攻略。美中不足的是,这份规划是以文字以及表格的形式呈现的,虽然在最后附上了一个百度网盘链接表示可以自取图片内容,但实际上该链接是无法打开的。

随后,记者进一步提出将规划以 HTML 格式呈现,Kimi K2 在随后交付的网页中补充了一些票务的信息,并完成了 " 图文并茂 " 的需求。不过,与官方演示的案例相比,网页整体的呈现质量还较为粗糙。

每经记者实测 Kimi K2 图片来源:Kimi K2 截图

值得一提的是,此前记者还使用类似的提示词测试过字节的扣子空间。对比两次测试结果可以发现,扣子空间在网页的设计上完成度更高、更为美观。Kimi K2 虽然在此略逊一筹,但旅游攻略制定上更为详细,给出了包括餐厅、景点在内的详细信息,还有如 " 交通卡当地退卡避免异地手续费 " 等注意事项。

此外,本次 Kimi 还特别展示了 Kimi K2 对文字输出风格的掌控,并且在虚构写作任务中,官方还表示:Kimi K2 生成的文字更关注细节与情感,不再是抽象泛泛而谈。记者也以 2025 年北京高考的作文题目 " 数字闪耀时 " 为例,假设 Kimi K2 为高中生,完成一篇一类的记叙文。从完成结果上来说,整体呈现效果良好,但在最后收尾的部分隐约透露出一些 "AI 味 "。

由 Kimi K2 撰写的北京高考作文 图片来源:Kimi K2 截图

Kimi 也从技术角度透露,为了支撑万亿参数模型训练的稳定性,Kimi K2 没有使用传统的 Adam 优化器,而是使用 Muon 优化器。MuonClip 优化器能够稳健支撑万亿参数模型训练,显著提升 token 利用效率。

Kimi 的下一步要走向哪?

Kimi K2 的突袭中,似乎隐含着要打一场翻身仗的决心。

2024 年 11 月,月之暗面创始人杨植麟在接受《每日经济新闻》记者采访时表示,将提升用户留存视为 Kimi 眼下最核心的任务。而在当时,Kimi 还是国产大模型之中备受瞩目的一个。

商业智能数据服务商 QuestMobile 数据显示,截至 2024 年 12 月份,豆包、Kimi、文小言的月活跃用户规模分别为 7523 万、2101 万和 1224 万。Kimi 位列原生 App 领域的 " 三强 " 之一。

随着今年年初 DeepSeek 的横空出世,整个市场格局被迅速打乱。

今年 5 月,《每日经济新闻》联合 QuestMobile 发布的《2025 年一季度 AI 应用价值榜》显示,Kimi 虽仍在月均活跃用户规模上位于第四,但其 2000 万出头的规模已经和以 1.8 亿排在第一的 DeepSeek 相差甚远。在 " 月均下载用户数环比增长 " 一项上,Kimi 甚至出现了负增长,用户数环比下降 3.8%。

2025 年以来,Kimi 对模型的更新升级速度明显放缓。但从 2024 年年底到今年 5 月份,Kimi 在似乎瞄准了垂类领域,寻找新的用户群,先后和财新传媒、小红书、网易游戏《逆水寒》达成合作。

此前 6 月 20 日,Kimi 发布第一个 Agent —— Kimi-Researcher(深度研究)。

据官方表示:" 模型即 Agent,Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。" 当时 Kimi 还表示将逐步开源 Kimi-Researcher 基础预训练模型,以及强化学习后的模型,如今来看的话应该就是本次发布的 Kimi K2。

知名经济学者、工信部信息通信经济专家委员会委员盘和林在接受《每日经济新闻》记者微信采访时对 Kimi 上半年的努力进行了分析。在他看来,Kimi 的努力方向是对的,但还不够,Kimi 需要将自己的 AI 嵌入到一个生态当中。如今,互联网平台各大生态是封闭的,比如电商的 AI 可以帮助商家设计网站,自媒体的 AI 能够帮助自媒体制作视频,那么,Kimi 的目标用户是谁?这方面,需要 Kimi 自己明确。

此外记者注意到,各家今年在升级大模型的时候往往也会 " 卷 " 到价格。

6 月 17 日,MiniMax 发布 MiniMax-M1 系列模型,并以 token 范围分段定价。在 0~12.8 万 token 范围内,据官方介绍,其定价均低于 DeepSeek-R1。

6 月 11 日,豆包大模型 1.6 正式发布时,火山引擎总裁谭待现场表示,豆包 1.6 首创按 " 输入长度 " 区间定价,深度思考、多模态能力与基础语言模型统一价格。豆包 1.6 的综合成本只有豆包 1.5 深度思考模型或 DeepSeek-R1 的三分之一。

而本次 Kimi K2 的定价和 DeepSeek-R1 基本持平。在盘和林看来,目前价格还不完全是竞争的关键因素," 因为同样价格的话,存在先入为主(的问题)。很多用户用过一个 AI,如果价格相同,为什么要去用另一个 AI?这个转换理由有两个,另一个 AI 更便宜,或者另一个 AI 更符合自己需要。我认为 Kimi 不能走低价,而是要走差异化路线。"

每日经济新闻

相关标签
每日经济新闻

每日经济新闻

经济数据提前公布,事实新闻一手掌握

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容