关于ZAKER 合作
蓝鲸财经 刚刚

连发推理模型、Agent 和多模态,MiniMax 不想掉出一梯队

图片来源:视觉中国

蓝鲸新闻 6 月 21 日讯(记者 朱俊熹)与大模型 " 六小龙 " 中趋于沉寂的其他几家同行相比,MiniMax 用连续 5 天的上新,带来了久违的热闹场面。自 6 月 17 日起,MiniMax 一周内相继发布了新的推理模型、视频生成模型、Agent、语音设计等产品。

其中,MiniMax-M1 是 MiniMax 推出的首个推理模型,官方介绍称是基于年初的 MiniMax-Text-01 模型开发得到的。一位 AI 算法工程师对蓝鲸科技记者表示,半年时间内从基础模型通过强化学习训练出推理模型,属于正常的节奏。" 不论是训练还是强化学习的方式,给业界的感觉就是 MiniMax 沿着 DeepSeek R1 的路又走了一遍。"

有媒体转述 M1 模型发布后,MiniMax 创始人、CEO 闫俊杰在社交媒体上表示," 第一次感觉到大山不是不能翻越。"

MiniMax-M1 模型延续了此前 MiniMax-01 系列基模的架构创新,即在 MoE 架构的基础上引入了闪电注意力机制(Lightning Attention)。和传统的注意力机制相比,闪电注意力机制就像在阅读长文时能让模型快速锁定重点,并不时浏览章节标题以把握整体脉络,从而减少计算和内存消耗,更适用于长上下文的处理。

上述技术从业者表示,尽管 MiniMax 在一月份释出了这一独创的混合架构,但目前各家大模型厂商依然按照各自的方式进行模型的迭代。" 基础模型的训练还是以稳定为主,如果更改架构的话,重新训练一旦效果不佳,可能会影响行业生态位。"

图片来源:MiniMax

得益于模型的混合架构,M1 在长文本方面具备显著优势。该模型支持目前业内最高的 100 万上下文的输入,与闭源模型中谷歌 Gemini 2.5 Pro 持平,是 DeepSeek R1 的 8 倍,同时支持最长 8 万 token 的推理输出。MiniMax 还提出了新的强化学习算法 CISPO,通过裁剪重要性采样权重,使强化学习训练中的 " 重要性评分 " 更合理,能够帮助模型更快、更稳地进步。

最终 M1 的强化训练过程实现了 " 超出预期 " 的高效。据 MiniMax 介绍,整个强化学习阶段只用到 512 块 H800 三周的时间,租赁成本只有 53.47 万美元,较最初预期少了一个数量级。

和同样强调长上下文能力的字节豆包大模型 1.6 相似,MiniMax-M1 也采用了分区间定价的方式。0-32k 的输入长度内,输入 0.8 元 / 百万 token,输出 8 元 / 百万 token;32k-128k 输入长度,输入 1.2 元 / 百万 token,输出 16 元 / 百万 token;最长的 128k-1M 输入长度,输入 2.4 元 / 百万 token,输出 24 元 / 百万 token。

MiniMax、字节等厂商此前也都强调过,长上下文的发展有助于促进智能体时代的到来。前述技术从业者解释称,Agent(智能体)的使用场景可以很复杂,例如 Deep Research 功能涉及大量超长文章的检索,长上下文能力自然越强越好。随着模型能力增强、MCP 等外部基础设施逐步成熟,现在是 Agent 发展长上下文能力的好时机。

此次 MiniMax 推出的 Agent 包括通用智能体和一款视频创作 Agent。通用的 MiniMax Agent 能够完成长程复杂任务,官方称在研发过程中是按照 " 靠谱的人 " 这一标准来设计和要求的,具体包括编程、多模态及 MCP 扩展。其中,多模态标准指的是支持长文本、视频、音频、图片等的全面理解,还应内置生图、生音频、生视频等能力。

Hailuo Video Agent 这款视频创作智能体瞄准的是零门槛的 Vibe Videoing。目前开放的第一阶段提供 Agent 视频模版,用户根据提示输入文字或图片,就可以一键生成创意短片。按照 MiniMax 的构想,第二阶段的半自定义视频 Agent 将支持用户在视频生成的任一环节进行自由编辑,第三阶段则实现完全形态的端到端视频 Agent。

多模态向来是 MiniMax 的一大竞争优势。此次 " 上新周 " 发布的视频模型 Hailuo 02 在 Artificial Analysis Video Arena 评测榜上排名第二,仅次于字节的 Seedance 1.0,但领先谷歌的 Veo 3 Preview。收官日发布的语音设计工具则支持定制生成多语言、任意声音与情绪的语音,由 5 月发布的语音模型 MiniMax Speech 02 提供支持。

随着新模型与产品的亮相,MiniMax 也公布了相应的付费方案。通用 Agent 采用积分制,优惠期内基础会员每月 19 美元,获得的 5000 积分大约可完成 15 个任务,Pro 会员每月 69 美元,获得的 20000 积分对应的大约是 60 个任务。视频 Agent 则在 MiniMax 的视频平台海螺 AI 上提供,同样设有不同等级的付费方案。这些都为 MiniMax 带来了新的产品营收路径,通过多点变现进一步完善其商业化版图。

图片来源:海螺 AI

从当前来看,大模型 " 六小龙 " 已走向各异。零一万物不再继续训练超大模型,百川智能放弃金融聚焦医疗,阶跃星辰开始收敛产品转向 Agent 方向,月之暗面相比基模推出的更多是编程、视觉语言等垂直模型。如果要踏上 IPO 之路,智谱、MiniMax 等 " 小龙 " 们仍然面临着一份复杂的商业化答卷有待完成。

相关标签