文 | 青橙财经,作者 | 青风,编辑 | 六子
中国 AI 领域一场悲壮的科技突围战正式打响!7 月 11 日深夜,AI 初创公司月之暗面发布全球首个开源的万亿参数大模型 Kimi K2。该模型在多项基准测试中达到开源模型的 SOTA(当前最高水平),API 调用成本与 DeepSeek R1 持平,仅为 Claude 4 的五分之一。
这款被寄予 " 生死突围 " 厚望的模型,在发布后 48 小时内引爆市场:Kimi 官网访问量激增 36 亿,开源社区 Hugging Face 下载量突破 10 万次,GitHub 相关项目数量飙升 200%。在 OpenRouter 平台上,K2 的 token 消耗量迅速超越马斯克的 Grok 4,登顶全球 API 调用榜。
抢在 DeepSeek R2 之前推出万亿参数大模型,并同样采取开源策略,这不仅是月之暗面的一次技术发布,更是这家被逼至悬崖边缘的明星创业公司,押上全部命运的一场豪赌——要么一战封神,要么黯然退场。
坠落神坛
曾几何时,凭借独树一帜的长文本处理能力和 AI 搜索功能,Kimi 风光无限。QuestMobile 数据显示,截至 2024 年 12 月,Kimi 月活跃用户(MAU)达 2101 万,稳居国产 AI 原生应用前三。
然而 2025 年市场风云突变。年初,DeepSeek 凭借低成本、高性能的开源模型强势入场,几乎零市场推广下,用户访问量 7 天破亿,迅速重塑全球 AI 格局,给包括月之暗面在内的众多玩家带来巨大冲击。
在 DeepSeek 的刺激下,AI 大厂们也随之加速布局:字节对豆包持续重金投入,稳守头部;阿里通义大模型频繁更新,打造全球最大开源模型,并将夸克推为 C 端旗舰;腾讯元宝借鸡生蛋,借势 " 接入 DeepSeek" 疯狂推广;百度急转开源免费,联动文库、网盘全力助阵。
巨头们挟资金优势、海量用户生态与强大工程化能力,在模型迭代、场景落地、生态构建上全面挤压创业公司的生存空间。月之暗面首当其冲。
用户数据最能体现冲击。QuestMobile 数据显示,截至 5 月,DeepSeek 移动端 MAU 为 1.69 亿,虽较 3 月的 1.94 亿有所下滑,但仍是用户量最大的 AI 原生应用,超过字节跳动的豆包、腾讯的元宝,更远超 Kimi。Kimi 的 MAU 已滑落至 1408 万,不足 DeepSeek 的十分之一。
用户流失的同时,月之暗面此前火热的融资节奏也戛然而止。过去两年,红杉中国、美团、阿里、腾讯等接连投资,将其估值推至 33 亿美元。但自 2024 年初获得当时国内大模型最大笔融资后,月之暗面 2025 年再无新融资消息。对极度烧钱的大模型研发而言,这无疑是危险的信号。
在此背景下,月之暗面创始人杨植麟做出两个关键决策:全面停止营销投放,集中资源攻坚基础模型;放弃 K1 系列迭代,All in 下一代架构研发。
Kimi K2 由此诞生——这是一次破釜沉舟的突围尝试。
发布当晚,联合创始人张宇韬在朋友圈写下,"Make Kimi Great Again"。这句话清晰传递出,月之暗面内部对 Kimi K2 寄予厚望,将其视为抵御 DeepSeek 冲击的关键,希望凭借新模型的强大性能和开源策略,重新吸引用户目光,夺回失去的市场份额,重回大模型竞争的核心舞台。
背水一战
从技术性能与市场反馈来看,Kimi K2 确有突围的潜力。
在技术层面,Kimi K2 的参数规模与架构设计颇具竞争力。其总参数达 1 万亿(1T),是当前大模型参数量的天花板,激活参数为 320 亿;采用 MoE(混合专家模型)架构,代码能力与通用 Agent(智能体)任务处理能力显著提升——能执行任务拆解、自主规划、工作流设计及工具调用等复杂多步骤任务。
性能测试更印证了其实力。在 SWE Bench Verified、Tau2、AceBench 等基准性能测试中,Kimi K2 均取得开源模型中的 SOTA 成绩。在细分维度上,编程能力仅次于 Claude 4 sonnet,智能体能力仅次于 Claude 4 和 GPT-4.1,数学推理能力则在 MATH、AIME、GPQA-Diamond 等测评中得分最高。
价格上,Kimi K2 也延续了 " 高性价比 " 策略:每百万输入 tokens 收费 4 元,每百万输出 tokens 收费 16 元,与 DeepSeek 标准时段的 API 价格体系一致。
为突出 Agent 能力,月之暗面官方提供了一些内部测试环境中的实际演示,比如,K2 可以帮助用户制定粉丝的追星计划,完成演唱会所在城市的机酒与旅游规划,并且生成日历,再用 html 概括完整行程规划并发送邮件。
这样的表现迅速引发海内外 AI 圈关注。OpenRouter 平台上线仅两天,Token 消耗量就超越 xAI,登顶全球 API 调用增长榜;在 Cline、Roo Code、Kilo Code 等平台,API 使用量在全球开源模型中排名最高。
独角兽 Perplexity CEO 在社交媒体表示,基于 Kimi K2 模型的出色表现,公司将会利用 K2 进行后训练,上一个被该公司用于技术训练的中国模型是 DeepSeek R1。全球最大开源 AI 社区 Hugging Face 联合创始人表示,不断突破极限挑战闭源的 K2 模型令人难以置信。不少社区用户也给出了不错的评价," 性能不输 Claude 4,但便宜 80%"、" 唯一超越 R1 的存在 "。《自然》杂志网站更是将 Kimi K2 发布称为 " 世界迎来又一个 DeepSeek 时刻 "。
月之暗面研发团队也全员在 Hugging Face、知乎等平台发声助威,其背水一战的决心可见一斑。对他们而言,K2 是一场生死攸关的救赎。如果 Kimi K2 能够在市场上获得良好的反响,将有助于月之暗面重新夺回市场份额,提升品牌形象,在 AI 大模型领域实现困境突围,重回行业第一梯队。
强敌环伺
尽管 Kimi K2 在技术上表现亮眼,月之暗面仍面临诸多强劲对手与严峻挑战。
Kimi K2 主打 " 模型即 Agent",重点强化代码与 Agent 能力。但目前智能体赛道的竞争已趋白热化,后来者既缺乏应用场景,更缺乏生态积累。
就在 7 月 18 日,OpenAI 就推出了 "ChatGPT Agent",能够智能调用浏览器工具(Operator)、深度信息整合(Deep Research)与语言生成能力(ChatGPT),完成包括在线购物、订餐预约、撰写研究报告、制作 PPT 和财务分析在内的多步骤复杂任务。
而除了国际厂商,国内的阿里夸克、百度文库、字节扣子空间等也均已布局 Agent,且坐拥上亿用户和更强的场景认知。不久前的高考填报志愿就是一个非常典型的 AI 应用场景,在这个细分领域,夸克和百度等均已经深耕多年,相关资源、高校数据和用户心智也都已建立起较高的壁垒。
"Kimi 的努力方向是对的,但还不够,Kimi 需要将自己的 AI 嵌入到一个生态当中。如今,互联网平台各大生态是封闭的,比如电商的 AI 可以帮助商家设计网站,自媒体的 AI 能够帮助自媒体制作视频,那么,Kimi 的目标用户是谁?这方面,需要 Kimi 自己明确。" 知名经济学者、工信部信息通信经济专家委员会委员盘和林,在接受媒体采访时如此表示。
此外,DeepSeek R2 仍然如同悬顶之剑。据称,R2 将拥有超过 1.2 万亿参数,重点方向就是智能体和多模态能力的加强。媒体爆料,此前因英伟达 H20 芯片禁售,R2 上线受阻;但 7 月 15 日英伟达创始人黄仁勋透露 " 美国已批准 H20 对华出口 "。这意味着 R2 最大阻碍已消除,上线在即。对月之暗面而言,这款被期待为 " 国运级 " 应用的大版本更新,可能是又一次冲击。
月之暗面更现实的挑战是算力与资金。有用户称,刚测试不到 10 个问题,K2 对话框便显示 " 当前模型对话次数已达到上限,可切换为其他模型继续对话 " ——这背后是大模型研发与运营的高成本,需要大量的 AI 芯片和巨大的计算资源消耗。在月之暗面迟迟没有新的投资入账的情况下,这一问题可能更为棘手。
而要想获得投资青睐,另一个更直击灵魂的深层问题也随之浮现:DeepSeek 之后,市场是否还需要自研基础大模型?若已有全方位开源的领先模型,创业公司推进自研的融资合理性何在?
巨头们拥有深厚的 " 血槽 ",DeepSeek 占据了用户心智和开源生态,月之暗面能否凭 K2 重新获得资本青睐,仍是未知数。
写在最后
回望 " 大模型六小龙 " 的发展轨迹,令人唏嘘,也可做借鉴,或许能更清晰看到月之暗面的处境。
2023 年全年,六小龙累计融资曾占到国产大模型厂商的逾 50%。而如今,格局已然大变:
零一万物已退出基础大模型竞争;百川智能也放弃了基座模型训练,收缩战线聚焦医疗垂类,且创始团队持续动荡;跃阶星辰几近失声;仅智谱 AI 与 MiniMax 近期有融资消息,但前者聚焦政企市场,后者押注多模态和出海方向,都避开了与 DeepSeek 及大厂们的正面交锋。
月之暗面尝试用 K2 证明,硬实力是最好的市场通行证,AI 竞赛还没有结束。然而,前有巨头与 OpenAI 的生态围堵,后有 DeepSeek R2 的虎视眈眈,加之算力掣肘与融资困局,其突围之路,注定比昔日更加崎岖难行。