36 氪获悉,小米 MiMo 大模型团队在官方技术博客发布文章,首次完整公开 MiMo-V2.5 系列大模型 API 永久降价背后的技术路径。文章称,MiMO-V2.5 实现了 KVCache 双池 +SWA-aware 前缀树、GCache 分布式缓存、KVCache 亲和调度、Decode 阶段 MTP 加速、多模态推理优化五大核心突破,降价后仍能维持收支平衡。此外,4 月 28 日推出的 " 百万亿 Token 创造者激励计划 ",总申请人数超过 54 万人,累计发放 100 万亿免费 Token,折合人民币超 6500 万元。
36氪
25分钟前