不是我不支持国产 AI。这事儿味儿太重了。
一家国内公司突然出来表示,我开源的新模型,在核心能力上已经和硅谷顶级公司的水平不相上下了。这个剧本是不是很像以前的?
坦率地说,这就好比班里一直处在中游水平的同学,在某一天拍出了一份成绩单之后说:" 这次我的总分和年级第一的那个学神一样了。" 大家的第一反应就是鼓掌,但是先去寻找橡皮擦的痕迹怎么样?
今天我们不谈那些天花乱坠的基准测试名。人类最后的一次考试,SWE-Bench Pro 也来了。" 名字一个比一个吓人。" 最简单的就是问:作为普通的开发者打开 Kimi Code 之后要它写一段稍微复杂一些业务代码怎么样?体验好不好?
我查看了社区最近几天的实时反馈,时间是在近几日之内。画风比较一致。
有一个叫 " 天空的影子 R" 的用户,他说得很直接:" 我比较过了,在国内 AI 中 KIMI 编程水平是最差的一个,基本上就是牛头不对马嘴。""
还有一个叫做 "Rockcen" 的吐槽付费版:" 就是稍微贵一点,基础的 coding plan 发几个命令都要等上一个五个小时
这就是最直接的用户声音。跟发布会上提到过的 "13 小时编码 4000 行 "、" 吞吐量提升到原来的十八倍 " 的数据放在一起看,特别魔幻。一个在空中飞翔,另一个在地上爬动。
那么问题来了,为什么会出现这样的分歧呢?
我认为问题出在两种不同的 " 价值坐标系 " 上。一个叫发布会的,另一个是生产力的。
发布会坐标系中,比拼的是极限场景下的秀肌肉。比如让 AI 连续工作 13 个小时来重构一个八年前的老旧金融引擎。震撼吗?很震撼吧?但是我们每天所面对的快速迭代、变动莫测的产品逻辑和业务需求又如何呢?不一定。
这就如同考核一个汽车工程师一样,并不要求他能迅速解决量产车常见的故障,而是把他的位置放到荒漠上,给他一堆原始零件让他自己动手制造出一辆可以行驶的车辆。能够保存下来的肯定是大师级的作品了。但是这说明他就适合去 4S 店工作吗?不一定好。"
Kimi K2.6 演示的是后者。一种实验室级别的、长期的专注于单一复杂任务的一种 " 极限编程 "。需要恐怖的时间长度以及工具调用次数。虽然很好,但是这是程序员最常遇到的需求吗?
而 GPT-5.4 或者 Claude 等人,则更早地转向了另一个方向:怎样在三五轮对话之内,准确捕捉到你模棱两可的需求,并且给出可靠的、实用的并且符合最佳实践的代码片段。它比的是理解力和交流能力以及快速对接的速度。

这其实是一种很聪明的 " 议程设置 "。它把舆论关注的重点强行拉到了自己想要让公众看到的地方。台下的真实、嘈杂而有摩擦感的人机交互体验?暂时可以忽略不计。
再来看开源的大旗。一开放,舆论就好了一半吧?自带 " 格局 " 光环的属性。但是我们也要思考一下,在这个时间节点上把 K2.6 开源出来,并不是一种技术上的理想主义吗?
业内有一个不能明说的共识,在闭源模型绝对性能上还没有形成碾压性的优势的时候,开源就是最锋利的市场切割器。用开源版本吸引大量的开发者来参与构建生态,并且形成了事实上的标准。真正的商业变现藏在云端 API 中、企业定制里以及那些不开源的大模型之中。
月之暗面这一步走得很稳当。直接用开源加持平 5.4 这套组合拳去冲击那些被 GPT 高价订阅费劝退、又对国内其他闭源模型能力不满的中间开发者群体。" 吉林市大光头哥哥 " 在评论区提出的问题很有代表性,就是问大家 " 现在订的是 chatgpt,在月底到期的时候能不能换一个 kimi?"
用户的脚是最真实的。他们已经开始用 " 换不换 " 来考虑了。开源宣言所带来的是直接的效果,它成为了一个新的、有力的选择。
但是选项,并不等于最优解。我特别想戳破的一个幻想是:开源了,就代表每个人都可以马上用上 " 发布会同款 " 的模型。多此一举就是多余的。
模型部署、算力成本以及推理优化,每一道都是门槛。对于大多数个人和小团队而言,真正可以无痛使用的还是官方提供的有限制的 API 服务。" 发几个命令就等五个小时 " 的 coding plan 才是你以后很长一段时间内要面对的生活常态。"
因此,这场发布会的狂欢背后其实是一场精准的认知卡位战。月之暗面用最炸裂的数据以及完全开放的姿态,在舆论上完成了一次漂亮的 " 奇袭 "。它使得人们不得不重新考虑自己在行业中的地位。
这是阳谋,而且很巧妙。
但是对那些真正要写代码、干活的普通人而言,情绪消退之后还得回到现实中来。哪个工具更稳定、便宜且不会闹脾气地帮助我完成工作就更好了。发布会上吹得再好听也不如本地跑通一个项目实在。
"Ai 创作之旅 " 在相关新闻下收到的评论,堪称人间清醒:" 别那么保守了,直接说暴打 Mythos 吧,反正就是吹呗,被骂也行啊,不如大点。"
带有自嘲、看透的意思。它把当前行业的一些事实暴露出来,在走向 AGI 的漫长马拉松中,阶段性的 " 口号 "、" 宣言 ",本身就是竞赛的一部分。激励团队、打击对手、争夺开发者、抬高股价。
因此,不要急着沸腾也不要急于嘲讽。玩一会儿让子弹飞吧。接下来的一两周里看 K2.6 开源权重到底能做出什么神奇的应用来,真正的开发者们会怎样去创造新的可能。看看它的 API 服务能不能扛住真实的流量以及复杂的需求。
