关于ZAKER 合作
手机中国 1小时前

雷军深夜放大招?小米发布三大自研 MiMo-V2 系列模型

【CNMO 科技消息】3 月 19 日凌晨,小米技术官方宣布,正式上线三大自研 MiMo-V2 系列模型,包括旗舰 Pro、全模态基座 Omni 以及语音合成 TTS,为 Agent 时代注入全新活力。

小米此次发布的 Xiaomi MiMo-V2-TTS 语音合成大模型,专为全模态交互设计,通过自研 Audio Tokenizer 和多码本语音 - 文本联合建模架构,实现了高度可控的多粒度语音风格控制。该模型支持从整体风格到局部情绪的精准调节,能够真实还原人类说话的自然韵律,甚至在唱歌时也能准确表达音高和节奏,展现出自然且富有表现力的语音生成能力。

与此同时,小米还推出了面向 Agent 时代的全模态基座模型 Xiaomi MiMo-V2-Omni。该模型融合了文本、视觉、语音的全模态感知与行动能力,原生具备多模态感知、工具调用、函数执行及 GUI 操作能力,可无缝接入各种 Agent 框架,大幅降低了全模态 Agent 的落地门槛。在匿名内测阶段,MiMo-V2-Omni 凭借其强大的感知与推理能力,在 OpenRouter 平台上的调用量持续攀升,并在 OpenClaw 测评榜单上拿下均分第一。

此外,小米还发布了面向高强度 Agent 工作场景的旗舰基座模型 Xiaomi MiMo-V2-Pro。该模型拥有超过 1T 的总参数量,支持 1M 超长上下文长度,通过 Scaling 参数和算力,实现了从 Coding 到 Claw 的重要泛化。在全球权威大模型综合智能排行榜上,MiMo-V2-Pro 位列全球第八,国内第二,展现了其领先的智能水平。

目前,MiMo-V2-Omni 和 MiMo-V2-Pro 模型已正式开放 API 服务,并联合多家 Agent 开发框架团队,为全球开发者提供限时免费接口支持。

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容