AIPress.com.cn 报道
4 月 23 日,小米 Mimo 研究所发文宣布,小米 MiMo-V2.5-Pro 及 MiMo-V2.5 模型开启公测,并即将开源,还有语音合成和语音识别系列紧随其后。
MiMo-V2.5 系列,四款模型同时亮相。
带队的人还是罗福莉。
如果你关注 AI 圈,应该知道这个名字。她是前 DeepSeek-V2 核心研发成员,业内人称 " 天才少女 "。
有意思的是,就在小米发模型的这个当口,业界盛传DeepSeek V4 将于本周发布。
一个前 DeepSeek 核心成员,带着新东家在最敏感的时间点亮剑了。
一、MiMo-V2.5 模型定位专为 Agent 场景打造
先搞清楚小米这次发了什么。
MiMo-V2.5 系列不擅长写朋友圈文案。它的定位极其明确,专为 Agent 场景打造。
MiMo-V2.5-Pro,小米迄今最强模型,专攻长难 Agent 任务。在 SWE-bench Pro(软件工程)、Claw-Eval(智能体评估)、τ 3-Bench(长程推理)等基准上,直接对标 Claude Opus 4.6 和 GPT-5.4。
它能稳定完成单次近千轮工具调用的长程任务,在超长周期内保持逻辑一致。
MiMo-V2.5标准版,原生全模态 Agent,覆盖图像、音频、视频,平均推理速度比 Pro 版更快(100-150 tokens/s),适合办公、数据分析等时延敏感场景。
当然了,光说参数没感觉,看三个官方实测:
北大编译原理课程项目:
用 Rust 从零实现完整 SysY 编译器,包括词法分析、语法分析、IR 生成、RISC-V 后端、性能优化。北大本科生通常做数周,MiMo-V2.5-Pro 4.3 小时、672 次工具调用,隐藏测试满分。
视频编辑器 Web 应用:
多轨道时间线、片段裁剪、交叉淡化、音频混合、导出流程。代码量 8192 行,11.5 小时自主完成,1868 次工具调用。
模拟电路 EDA 设计:
基于台积电 180nm 工艺设计 FVF-LDO 稳压器,连接 ngspice 仿真闭环迭代,约一小时生成满足全部指标的设计,部分指标比初始版本提升一个数量级。
这些任务的核心特征在于:它们重在独立完成项目,绝非简单回答问题。
至于网红问题,50 米洗车该走路还是开车,
小米的新模型是这么说的:
二、小米选择的突破口 Agent 时代的效率优先级
OpenAI 强在通用能力和品牌护城河,DeepSeek 强在极致性能和开源生态。小米凭什么插一脚?
凭的是Token 效率。
在 Agent 基准 ClawEval 上,MiMo-V2.5-Pro 拿到相同分数的情况下,比 Kimi 本周发布的 K2.6省了 42% Token;MiMo-V2.5 比 Meta 的 Muse Spark省了 50% Token。
别小看这个数字。Agent 任务绝非一问一答,往往涉及几百上千轮的工具调用、代码执行、错误诊断、自我修正。
Token 消耗是指数级增长的,省 42% 意味着同样的预算,任务完成率大幅提升。
在 ClawEval 的散点图上,MiMo-V2.5 系列牢牢占据左上角最优区域,即通过率高且 Token 消耗低。
而 DeepSeek V3.2 位于右下角,通过率低且 Token 消耗极高。
技术路线已经出现分化。
省钱本身就是一种技术壁垒。
三、DeepSeek 前核心成员罗福莉带队
罗福莉不是普通研究员。在 DeepSeek 期间,她是 V2 模型的核心研发成员。DeepSeek-V2 去年以极致性价比震动行业,罗福莉是背后关键推手之一。
加盟小米后,她只花了36 天就把 MiMo 从 V2 迭代到 V2.5,性能从接近一线拉到对标顶尖。
更戏剧性的是,今年 3 月,MiMo-V2-Pro 曾以 "Hunter Alpha" 的匿名身份上线 OpenRouter 平台,被大量开发者误认为是即将发布的 DeepSeek V4。
一个小米的模型,被当成 DeepSeek 的下一代旗舰,这说明什么?说明在硬核开发者眼里,罗福莉出品,天然带有 DeepSeek 级别的技术预期。
当 OpenAI 靠 Altman 的品牌、DeepSeek 靠梁文锋的极客文化吸引顶尖人才时,小米靠的是罗福莉这样的技术 IP。
她不仅带来算法能力,更带来一套已经被验证过的高效训练 + 极致推理的方法论。
四、Mimo 模型的竞争力人车家生态同步
OpenAI 没有手机,DeepSeek 没有汽车,Kimi 没有 IoT 生态。小米有6 亿 + 月活设备,有 SU7,有澎湃 OS,有从手环到电视的全场景入口。
现在谁家里没有一两件印着小米 Logo 的东西呢?
你的手机 Agent 自动整理相册并剪辑旅行视频;你的车机 Agent 根据实时路况和电量规划跨省路线;你的家庭 Agent 协调空调、灯光、扫地机器人完成 " 回家模式 "。
这类任务超出了 ChatGPT 的能力边界,因为它们需要理解物理世界、调用硬件工具、在端侧高效运行。
小米自己做基座模型,目标绝非在榜单上打败 OpenAI,核心诉求在于不让自己的生态命脉掌握在第三方手里。
当 Agent 成为下一代交互方式时,没有自研模型的大厂,才是真正的 " 组装厂 "。
五、DeepSeek V4 前夜发布
说到这儿,必须回到那个最敏感的话题:DeepSeek V4。
业内传闻,DeepSeek V4 将于本周发布。而小米选择在这个时间点发布 V2.5,很难说是巧合。
罗福莉从 DeepSeek 到小米,带走的东西远超某段代码本身,核心是对 Scaling Law 和 Agent 架构的深度理解。
当 DeepSeek V4 本周真的发布时,行业会再次为性能数字沸腾。
但不要忘了,就在它发布的前夜,一个硬件大厂已经证明:
AI 竞争的下半场,核心看点已从谁更聪明,转向谁更能落地。
而落地,恰恰是小米最熟悉的主场。