关于ZAKER Skills 合作
钛媒体 35分钟前

Anthropic 交表,MiniMax 冲 A,而我最想聊的是 M3 大模型

文 | 互联网怪盗团

Anthropic 刚刚向美国 SEC 递交了保密的招股书,一个万亿美元市值的 IPO 即将诞生——这也是迄今为止,AI 产业规模最大的 IPO。差不多同一时间,MiniMax 开始冲刺 A 股上市。今年是人工智能的资本大年,也是技术和应用大年。归根结底,是技术进步推动了 AI 商业化的加速发展,从而进一步推动了资本市场的乐观情绪。这是本轮人工智能牛市与 1990 年代后期的互联网泡沫最大的不同点!

整整两个月以前,我跟一位在 AI 领域颇富经验的投资人朋友喝茶,讨论国产大模型公司的特点和战略定位。在谈到 MiniMax 时,我的观点是:" 应用层做得不错,市场推广也很好,海外应用尤其成功。但是在基础模型技术上,似乎没有特殊之处,让我感觉不到特色。" 出乎我意料的是,对方马上进行了全方位的反驳,表示:" 低估 MiniMax 的基础模型实力,是很多人常犯的错误,尤其多见于资本市场。" 当时他没能说服我,但是留下了一个预言:" 几个月之内,你会重新审视对这家公司的技术水平的看法。" 附带说一句,我们的讨论与资本市场的短期波动完全无关,当时如此,现在也是如此。

6 月 1 日这一天,这件事情果然发生了:MiniMax M3 大模型发布。不巧的是,在此前后,包括 MiniMax 在内的中国 AI 上市公司经历了普遍的深度调整,导致在社交媒体上,对模型的讨论基本让位于对股价的讨论(我对此深感遗憾)。而且由于今年以来,国产大模型更新频率太快,热门模型此起彼伏,很多人可能忽视了这个模型的特殊意义。但是对于 AI 编程以及 Agentic Workflow 的重度用户来说,应该能迅速掂量出这个模型的分量:

具备强大的 Coding/Agent Frontier 能力;

具备 1M Context Window(上下文窗口);

原生多模态能力,能理解图像、视频等多模态信息;

开源。

在国产大模型当中,MiniMax M3 是第一个集齐了前三项(不妨称之为 "Frontier 三件套 ")的。一个多月前发布的 DeepSeek V4 是一个很优秀的模型、已经积累了大量用户,但它是一个纯文本模型,暂不具备原生多模态能力。很多国产大模型有多模态能力,但要么上下文窗口偏小,要么 Coding 能力不够强,或者二者均有瑕疵(在此就不逐一点名分析了)。

而在全球范围内,只有 Claude Opus 4.8, GPT 5.5, Gemini 3.1 等前沿大模型具备 "Frontier 三件套 ",但是很可惜,它们都不开源。MiniMax M3 是迄今为止出现过的 Coding/Agent 能力最强大、最全面的开源大模型,这不仅是我个人的观点,也是许多专业评测者的观点。" 硅谷闭源模型 VS 国产开源模型 ",这不仅是一种媒体或资本市场的叙事范式,更是板上钉钉的现实趋势,而 MiniMax M3 的发布进一步确认了这一趋势。

嗯,不妨更准确地说—— " 高价的硅谷闭源模型 VS 低价的国产开源模型 "。国产大模型的 Token 定价一贯以价廉物美、量大管饱著称,与十分昂贵的 Claude 形成了鲜明对比;而 MiniMax M3 的定价即便在国产大模型当中也是颇具竞争力的。就拿个人开发者的 Token Plan 付费方案来说,Max 售价为每月 119 元人民币,提供 18 亿 Token,相当于 Claude Max 5x(每月 100 美元)容量的 2 倍,平均每 100 万 Token 的售价仅为 0.066 元。MiniMax 官方显然认为,这样的定价对当前的模型能力和使用场景是最适合的。

当然,需要承认的是,在尖端的 Coding 能力上,Claude 仍然难以替代,这是它索取溢价的底气。但是在大部分日常 Agent Workflow 当中,M3 能够以很高的性价比提供令人满意的效果——大部分用户需要的不就是这个吗?在此援引知名 AI 技术大牛、Vercel CEO Guillermo Rauch 的评论:"MiniMax M3 ……仅仅略逊于 Opus & GPT5, 但是要便宜 10 倍。" ( Right behind Opus & GPT5, but 10x cheaper. )

Artificial Analysis ( AA ) 综合智能指数排行榜,MiniMax M3 位列全球第七,这也是开源模型的全球最高排名

短短半年之前,资本市场还在争论 " 生成式 AI 什么时候才能跑通可持续的商业模式 "。现在这已经不是问题了,因为已经跑通了,Anthropic 刚刚递交了招股书、今年二季度即将实现盈利,OpenAI 也快了。大模型的所谓 "Token 经济学 " 已经彻底建立起来了,卖 Token 成为了一门前途无量的生意,其核心推动力有二:第一是由 OpenClaw 推动的 Agent 风潮,第二是以 Seedance, Happy Horse, Veo 等为代表的视频大模型热潮。二者都具备很强的生产力属性,都会消耗大量 Token;更奇妙的是,用户认为消耗的 Token 是值得的,买的越多,赚的就越多。双赢的生意!

今年一季度,我认为 MiniMax 的 Coding & Agent 能力无足轻重,因此低估了它。然而,M3 足以彻底让包括我在内的所有人改变态度——与上一版本 M2.7 相比,它的进步是革命性的。在涵盖软件工程、终端执行等多个维度的国际权威 Benchmark Test, 例如 SWE-Bench Pro 当中,M3 达到了国际领先水平,甚至超过了 GPT-5.5 和 Gemini 3.1 Pro,仅落后于 Claude Opus 4.7。我注意到,哪怕是一些对 MiniMax 家的 Coding 能力持保留意见的评测者,也表示:" 今后养龙虾的任务完全可以交给 M3 去做。"

附带说一句,专门为 M3 设计并与 M3 一起训练的 Coding Agent 产品 MiniMax Code,已经与 M3 在同一时间发布了。明眼人都知道,今年年初以来 AI Coding & Agent 的大火,只有一半归功于基础模型的进步,另一半则应归功于 Claude Code 和 GPT Codex 这两大工具的发布——它们标志着 Vibe Coding 真正进入了 Agentic 时代,AI 不仅能生成代码,还能像训练有素的软件工程师一样彻底理解任务,建立、修改和维护真实的软件系统。Vibe Coding 的格局一打开,Token 经济学的前景就无人能质疑了,怪不得马斯克的 xAI 要斥资 600 亿美元收购 Cursor,其实就是买一张 Agent 时代的门票。

做基础模型难,做 Agent 也难,所以过去半年,虽然出现了多个有一定编程能力的国产大模型,但国产 Coding Agent 还是一片空白,开发者还得用 Claude Code 等第三方工具接入。换句话说,直到几天前,国产 AI Coding 还处于 " 有模型、无 Agent" 的阶段,在工具层面,大部分开发者直接接触的仍然是海外先进 Agent。这一次,MiniMax Code 算是填补了一个空白。平心而论,这款工具目前还处于草创阶段,还需要一个打磨产品功能、积累用户基础的爬坡过程。如果做得好,那么基础模型 +Agent 工具可以发挥 1+1>2 的作用;做的不好也不是大问题,用户仍然可以通过其他 Coding Agent 去操作 M3 以及后续版本的模型。我不是技术专家,对于 MiniMax Code 的未来就先不下结论了,未来几个季度应该能看到端倪。

MiniMax M3 的上下文窗口高达 1M,这一点很重要,因为上下文窗口必须足够长才能容纳复杂的输入输出,大部分人都能理解。而原生多模态能力这一条很容易被人忽视。很多人会认为,国内有 Seedance、可灵,国外有 Veo、Luma,多模态赛道已经很拥挤了,MiniMax 的原生多模态有什么特别的实用性吗?如果是在过去,我恐怕也会提出同样的问题;可是最近两个月,我一直在做 AI 视频行业的深度调研,对这个问题还是有点发言权的。

多模态是一个复杂的概念,既包括多模态内容的输出,也包括对多模态输入的理解。M3 具备对图像和视频内容的理解能力,结合强大的 Coding 能力,就可以解锁很多复杂的玩法——例如输入一段游戏视频,让模型分析核心玩法,然后试图编程复刻一个,或对其进行修改;又例如输入一段监控录像,规定什么样的情况需要标记、示警,让模型进行逐帧分析和标记;还有输入一大堆参考图像、参考动画段落,让模型总结人设和场景美术特点,乃至在此基础之上做新的美术策划案……

不要忘记,MiniMax 还拥有文本、语音和视频大模型,可以做到不同类型内容的互相输入和生成。电影《阿嫲的情书》最近大火,同款情书成为了小红书爆款内容,基于 M3 可以轻易做出 " 侨批生成器 "。对于 AI 短剧制作者来说,这更是福音,把剧本文本、参考图片和视频一起扔进去作为 Prompt,就可以直接生成复杂的视频内容。M3 超长的上下文窗口,则允许了创作者对视频进行反复修改。时至今日,绝大部分 AI 短剧还需要专业工具包进行辅助创作,门槛比一般人想象的要高。前不久 Google I/O 大会发布的 Omni 多模态大模型,让人看到了在一个对话窗口内直接完成全套创作任务的可能性;尽管目前与 Omni 还有功能上的差距,但是假以时日,或许 MiniMax 也能提供类似的可能性。

因此,Coding/Frontier 能力、超长上下文窗口、原生多模态能力,三者构成了一个密不可分的整体,同时覆盖了当前 Token 经济学的两个焦点—— Coding & Agent 以及视频生成。在此基础之上开源,则更加难能可贵,大幅扩张了开发者生态圈。我经常感叹:硅谷的一线 AI 大厂,包括 OpenAI 和谷歌,早年都走过开源路线,可是技术越进步就越倾向于闭源;xAI 一度将开源作为卖点,但是自从 Grok 2.5 以来也不再开源。时至今日,硅谷的开源大模型生态,也就剩下 Meta 的 LLaMA 系列、谷歌的 Gemma 系列以及 OpenAI 偶尔发布的几个小参数模型了,它们普遍比前沿大模型至少落后半代。这真的符合 AI 的普惠原则吗?

反观中国,MiniMax, Qwen, Kimi, DeepSeek ……的前沿大模型都有开源版本,M3 更是全球第一个集齐 "Frontier 三件套 " 的开源模型。在 X 和 Reddit 等美国社交媒体上,我们到处可以看到吐槽:当硅谷厂商把自己最先进的大模型严防死守不开源时,中国厂商却在以极其低廉的成本提供开源的前沿大模型。这究竟是单纯的商业模式选择不同,还是某种更深层次的不同?到底哪一方才代表了开放、平等、普惠的大趋势?

对于这个问题,我同样不敢妄下结论。我只能说:MiniMax M3 是一个很好的模型,让我很激动,希望它以及其他中国大模型厂商,能够不断做出类似的既强大、又开放、人人皆可负担的大模型。我还想补充一句:以大模型为基础的生成式 AI 对人类社会的改造是以十年乃至更长时间为单位的,因此我不赞成聚焦于资本市场的短期变化——每天、每星期,资本市场都会因为各种各样的情绪而波动,但这并不影响基本面,尤其不影响基础研发和科技进步的大方向。

相关标签

相关阅读

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容