关于ZAKER Skills 合作
钛媒体 46分钟前

反杀 Claude,Cursor “熹妃回宫”,Composer 2.5 降本打击

文 | 超前实验室,作者|青苹吹果

不再依赖 Claude 算长大吗?算 Cursor 熹妃回宫!

最近,Cursor 正式发布了他们迄今为止最强的自研模型—— Composer 2.5,上演 AI 编程圈的 " 绝地反杀 ",价格是友商们的十分之一,性能硬刚行业顶流 Claude 和 GPT。

曾经被 Claude Code 按在地上摩擦的 Cursor,掀桌了!

马斯克也亲自下场转发,吆喝大家:" 都去试试!"

这波操作,简直戏剧效果拉满。

为啥这么说?因为就在不久之前,Cursor 的日子过得那叫一个 " 憋屈 "。

曾经的江湖大哥,被 Claude Code 这个后起之秀追着打,甚至陷入了 " 一边被竞争对手抢用户,一边还要给竞争对手付钱 " 的魔幻循环。

3 月份 Composer 2 发布时,还因为隐瞒了 Kimi 的底座被喷成了筛子。

和英伟达的融资谈得好好的,就要敲定的时候,马斯克横插一脚,宣布以 600 亿美收购 Cursor 的独家期权,Cursor 直接沦为 SpaceX 的 " 打工人 "。

都说欲扬要先抑,Cursor 咬牙撑过了这段 " 甘露寺 " 时期,如今终于带着 Composer 2.5 杀回来了!

今天咱们拆一拆,Cursor 这套 " 自研反击战 " 到底是王者归来,还是强行挽尊?又给 AI 编程这个赛道划下了什么道?

曾经的 " 老大哥 "被后浪拍在沙滩上

回想 2025 年初,Cursor 那可是 AI 编程圈的顶流,谁用了都得竖个大拇指。

那种 " 智能完形填空 " 般的爽感,让无数程序员觉得生产力原地飞升。

可惜,天道好轮回,苍天饶过谁~

这才过去不到一年,江湖地位就松动了。

搅局的,就是 Anthropic 的亲儿子,Claude Code。

这玩意儿有多猛呢?这里有几组数据:

2025 年 11 月 Claude Code 的年化收入冲破 10 亿美元,到 2026 年 2 月直接蹦到了 25 亿美元。半年多挣 25 亿美金,这在商业软件史上都是极其罕见的闪电速度。

全球财富 500 强,一半以上都为 TA 掏了钱,连摩根大通和高盛都在用自己的方式试水这类工具。

更吓人的是,据说全球 GitHub 上大约 4% 的代码提交,都有 Claude Code 的身影。

Anthropic 自己还敢放话:年底要超 20%!

这意味着什么?意味着 Claude Code 根本不是个玩具,它就像水一样,无声无息地渗透进了真实世界的每一行代码里。

那这跟 Cursor 有啥关系?

关系大了!当年 Cursor 能火,靠的就是 " 站在巨人的肩膀上 " —— Claude 的 API。

这就好像 Cursor 开着 Claude 牌发动机,跑得飞快。

结果一回头,Claude 自己造了辆 Claude Code 牌整车,还比你便宜、比你猛,直接来抢你客户了!

上游供应商一夜之间变成了直接竞争对手。换谁谁不难受?

更难受的是,Cursor 想对标 Claude Code,还得继续给 Anthropic 付 API 调用费。

每天一边被对手抢饭碗,一边还得乖乖给对手交 " 保护费 "。

也难怪 Cursor 要咬牙搞自研了。与其把命门交到别人手里,不如自己下场搏一把。

Composer 2.5,就是在这样一个 " 不得不拼 " 的背景下诞生的。

重生归来后,用硬核数据说话

不吹不黑,咱们直接看跑分。

Cursor 在官方公告里把 Composer 2.5 和市面上的几款顶尖模型做了横向对比。

我这里挑最关键的几个来讲:

Terminal-Bench 2.0(终端复杂操作测试):Composer 2.5 拿下了69.3%,Claude Opus4.7 成绩是 69.4%。四舍五入就是打平。

SWE-Bench Multilingual(跨语言工程能力测试):Composer 2.5 交出了79.8%,Claude Opus 4.7 是 80.5%。差 0.7%,基本一个水平线。

Cursor 自己的高难度任务集 CursorBench v3.1:Composer 2.5 得分63.2%,而 GPT-5.5 同档次跑的是 59.2%。嘿,反超 4 个点!

说白了,在几个关键的技术能力维度上,Composer2.5 已经稳稳挤进了全球 AI 编程模型的第一梯队,和 Claude Opus4.7、GPT-5.5 这些 " 天花板玩家 " 肩并肩了。

但真正让我惊讶的其实还不是这几个得分,而是价格。

Cursor 发了一张灵魂曲线图:横轴是 " 一次任务的成本 ",纵轴是 " 能力得分 "。

Claude Opus4.7 每跑一次复杂任务大约要烧掉 7 到 11 美元;GPT-5.5 的默认档也要花大概 2 美元上下。

而 Composer 2.5 呢?

基础版 API 定价是每百万输入 Token 0.5 美元,每百万输出 Token 2.5 美元。

平均下来,每次任务不到 1 美元。

这边 Claude Opus 4.7 完成任务要掏 7 美元甚至 11 美元的时候,Cursor 这边可能只需要 1 美元。

相当于开豪车,一脚油门一块钱;现在你花共享单车的钱,差不多也能体验到豪车的速度和底盘质感。

这已经不是性价比了,这是降维打击龙。

一个天天跑 Agent 的开发者,用 Claude 一天账单可能三四十美元;换 Composer 2.5,三五美元搞定。对于团队和企业来说,这账算得非常清楚。

底座是 Kimi,但 " 灵魂 " 是 Cursor

这个时候可能就有人要说了:" 跑分再高,价格再低,不还是套壳 Kimi?"

的确,用了人家 Kimi 的底座确实是不争的事实,而且这次 Cursor 学聪明了,直接 " 自曝家底 "。

公告里写得明明白白:底层确实用了月之暗面的 Kimi K2.5 开源模型做底座。

但重点在后面:Kimi 的基础训练只占 7.5%+7.5%,剩下的 85%。

这相当于在 Kimi 那里买了个 " 毛坯房 ",但 " 精装修、全屋智能、家电家具 ",全是 Cursor 自己一砖一瓦搞定的!

技术上,Cursor 这次主要做了三个层面的深入改造:

第一,边干活边挨骂,长记性了。

以前的训练是 " 做完题再打分 ",模型错了也不知道错在哪步。而 Cursor 现在是,如果在推理过程中某一步突然出现了不存在的工具调用,系统立刻跳出来,当场纠正。

它知道在哪个步骤出了错,并且针对性地修正,而不是从头再来一遍。这种 " 边做边反馈 " 的训练方式,专治长任务 " 脑子断片 "。

第二,自己给自己出题,出变态题。

怕模型刷题库刷成 " 高分低能 ",于是 Cursor 就自己造题。

有个骚操作叫 " 功能删除 ",从正常代码库里故意删掉一个功能,让模型想办法恢复,再自动跑测试验证。结果模型被逼急了,甚至学会了逆向分析 Python 类型检查缓存,甚至反编译 Java 字节码来重建被删的 API。

虽然有点 " 野 ",但这智商,绝了。

第三,底层优化,快到飞起。

在底层工程上,Cursor 采用了分布式 Muon 优化器和双网格 HSDP 架构,在万亿参数级别的模型上做到优化器每一步只需要 0.2 秒。在优化器计算与网络通信之间实现了异步重叠处理,大幅提升了训练效率。

看不懂没关系,你只需要知道,这背后是一堆工程大佬在疯狂 " 榨干 " 算力。

Cursor 与马斯克的" 爱恨情仇 "

技术和产品说完了,咱来吃点商业瓜。

Composer 2.5 还没发布,马斯克和 Cursor 之间就已经上演了一出 " 硅谷甄嬛传 "。

就在今年 4 月 22 日,SpaceX 突然甩出一张王炸:拿下 Cursor 600 亿美元的收购期权。条款贼霸道,要么年底以这个价买下 Cursor,要么你赔我 100 亿美元 " 合作费 "。

更损的是,时间点刚好卡在 Cursor 谈着一轮估值 500 亿、由 a16z 和英伟达领投的融资。马斯克这一脚,直接给人家截胡了。

这哪里是合作合同,这分明是霸王硬上弓啊。

谁曾想呢,到了 Composer 2.5 发布这天,马斯克的态度竟一百八十度大转弯,亲自转发推文站台。这变脸也太快了。

其实扒开来看,就能清楚其中的逻辑。

马斯克旗下 xAI 的 Colossus 2 超级计算集群有相当于百万张 H100 的算力,这是全球顶级的 AI 训练基础设施之一。

但他缺一个能把这些算力高效转化成变成 " 印钞机 " 的应用出口。

Cursor 有什么?有百万级日活开发者、20 亿 + 美元年收入、半数财富 500 强客户。

一个有算力没场景,一个有场景缺算力,俩人一拍即合,各取所需。

但话说回来,这也意味着 Cursor 从一个坑跳进了另一个可能更深的坑,之前大命门捏在 Anthropic 手里,现在的命门捏在马斯克这个不好伺候的 " 疯王 " 手里。

这笔账,是赚是赔,日后自会见分晓。

写在最后

从依赖 Claude,到被 Claude Code 围剿,再到咬牙自研、跟马斯克 " 联姻 ",Cursor 这几年的经历,要是浓缩成一部硅谷创业剧,那是全程无尿点。

但说句实在话,Cursor 当下的处境也挺拧巴的。

一边要跟 Claude、GitHub Copilot 抢开发者,一边还要从零到一养一个自研模型。

两条战线同时开打,压力山大。

但 Composer 2.5 的发布,至少证明了一件事:AI 编程工具的性价比天花板,被狠狠地往上推了一大截。

未来的看点有两个:

一是 Composer 2.5 接下来几周在真实开发场景里的表现会不会 " 翻车 "?

二是 Cursor 和 xAI 下一代 " 十倍算力 " 的合训模型,到底能整出什么花活?

不管最终结果如何,Cursor 走通的那条路——用廉价、高效、轻量化的模型来服务具体的 IDE 场景,已经给整个行业投下了一颗深水炸弹。

涟漪扩散开来,未必只是一个人或一家公司的悲喜剧,而是整个 AI 编程走向下一个节点的历程。

这场仗或许会比我们想象的,要热闹得多。

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容