APP下载

关于ZAKER

Skills 合作

科技每日推送 10分钟前

突发，小米降价 99%，成价格屠夫！

作者 | 赵芷姗

编辑 | 周伟鹏

继 DeepSeek 宣布永久降价后，又一家国产大模型宣布降价了。

5 月 27 日凌晨，小米宣布 MiMo-V2.5 系列 API 永久降价，最高降幅达 99%，且不再区分输入长度。

同时对 Token Plan 计费体系进行优化，同样的套餐价格，用量提升至原来的 5-8 倍。

所有已订阅 Token Plan 且在有效期内的用户，从今天 0 点起全部重置按照新计费规则执行。

小米创始人雷军，随后在微博也转发了这条降价消息。

国产模型降成白菜价

对比国外模型价格优势明显

公告显示，MiMo-V2.5-Pro 调价后，输入缓存命中价格降至 0.025 元 / 百万 tokens，输入未命中缓存 3 元 / 百万 tokens，输出 6 元 / 百万 tokens。

它跟几天前 DeepSeek-V4-Pro 宣布降价后的价格刚好一致。

自今年年以来，国内头部大模型厂商已掀起一轮持续、全面的降价潮，价格堪称 " 白菜价 "。

按照每百万 tokens 的单价，Kimi-k2.6 缓存命中输入价 1.1 元，缓存未命中输入价 6.5 元，输出价 27 元。

其他模型价格具体如下图：

而对比海外主流模型，国产大模型的价格优势堪称碾压级。

MiMo-V2.5-Pro 的输入价格仅为 Claude-opus-4.7 的三十六分之一，输出价格更是达到九十分之一。

在这样巨大的价格差下，一些外国码农都受不了，反向代购中国大模型。

硬件和云在暴涨，token 在暴跌

利润到底从哪来？

极具反差的是，当国内模型 token 降价的同时，底层的硬件、云算力成本却在持续暴涨。

全球 AI 算力、云服务、硬件设备全面进入涨价周期，彻底终结了云计算二十年 " 只降不升 " 的行业惯例。

国内阿里云、腾讯云、百度智能云三大头部厂商，先后上调 AI 算力产品价格，涨幅区间 5%-34%。

同时，高性能存储、算力租赁、服务器整机价格同步上涨，英伟达 H100 GPU 年租赁价格涨幅近 40%，部分腾讯云 AI 算力服务涨幅更是高达 400%，海外 AWS、谷歌云同步跟进涨价，全球 AI 底层算力成本全面走高。

按理说，上游成本上涨必然带动下游模型涨价，但国产大模型却反向降价，它们的利润都从哪里来？

答案藏在推理效率里。

大模型 API 的成本结构正在发生质变。过去，成本大头是模型训练和参数存储；现在，随着模型开源、蒸馏技术成熟，训练成本被摊薄，真正的战场转移到了推理环节：如何让每一次 API 调用的算力消耗更低、吞吐更高、延迟更短。

尤其是在长上下文、Agent、多轮对话场景下，真正的吞金兽是 KV Cache。

可以把它理解为模型推理时对上下文的 " 记忆 "。上下文越长，缓存就越庞大，吃掉的显存也越恐怖。很多长上下文模型定价高昂，本质上不是因为 " 更聪明 "，而是缓存成本居高不下。

小米这次的技术攻坚，正是冲着这个痛点去的。

DeepSeek V4 系列之所以敢定价 0.025 元，也是因为在推理框架、缓存系统和集群调度上做了深度优化。

硬件贵了，但单位 token 消耗的算力下降得更快。

另外，薄利多销的逻辑在这里依然有效。模型降价后，开发者不再吝啬调用量，Agent 框架、多轮对话、长文档分析的消耗量会指数级增长。

中美大模型之战

谁是赢家

于是到这里就会产生一个问题：

当中国大模型价格只是美国的顶尖模型十分之一，而功能却能达到百分之八九十，那么这场模型大战，中国凭什么输？

过去两年里，业界普遍有一种担忧：中国在基础模型能力上始终落后 OpenAI 和 Anthropic 半步，从 GPT-4 到 Claude 3.5 再到 GPT-5.5，每次发布都在拉大差距。这种焦虑是真实的。

但价格带来的强劲竞争力，也是客观的。

企业在采购 AI 服务时，决策公式从来不是选最强的，而是选性价比最高的；当 token 便宜到忽略不计时，开发者不用再精打细算，可以大胆进行设计，从而催生出独有的应用生态。

国产大模型厂商正在把大模型做成新时代的水电煤：便宜、稳定、随取随用。

按照商业发展的规律，最后赢的，往往不是技术最强的那个，而是让技术变得最便宜、最普及的那个。

中国大模型显然已经走在了这条路上。

END

欢迎点击科技每日推送视频号，看最新视频 ~

↓↓↓

易简传媒为一家新三板挂牌公司 ( 股票代码 :834498 ) ，旗下新媒体微信粉丝 2500 万 +，讲述各行业的精彩故事，欢迎大家

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

企业资讯

查看更多内容

Blockchain News

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

突发，小米降价 99%，成价格屠夫！

宙世代

一起剪

相关阅读

张雪：我不是因为爱国而不买苹果 也不认为买苹果的人不爱国

带摄像头的 AI 耳机能替代 iPhone 吗？我戴了 72 小时之后有了答案

三体公司回应许垚被执行死刑，小米发布世界模型全新框架，抖音电商上线跨境新要求，北京汽车制造厂不能用北汽，这就是今天的其他大新闻！

卢伟冰明确：小米汽车2027年三四季度启动出海！

都猜错了！安卓首款阔折叠定名三星Galaxy Z Fold8：对标华为Pura X Max

中国AI用户累计注册数超31亿 公众对治理规范诉求强烈

美联航与Lyft洽谈企业差旅合作，拟打通空中+地面奖励闭环

小米集团：第一季度新车交付量达到80856辆，同比增长6.6%

“韬定律”：华为芯片的底层秘密

6.4万 中国市场最贵辅助驾驶系统！特斯拉FSD已在国内灰度推送约5000台车

工信部：推进控制芯片、计算芯片、车内通信芯片、安全芯片、功率芯片等标准审查报批

余承东官宣黄渤成问界M9品牌大使 黄渤：很遗憾不能去感受现场 但爱车档期不想有半点遗憾

长寿≠养生？有人把“解决衰老”做了工程化拆解

三星加速AI转型：下月将允许部分员工使用外部AI模型

最新评论

科技每日推送

企业资讯

张雪：我不是因为爱国而不买苹果也不认为买苹果的人不爱国

中国AI用户累计注册数超31亿公众对治理规范诉求强烈

6.4万中国市场最贵辅助驾驶系统！特斯拉FSD已在国内灰度推送约5000台车

余承东官宣黄渤成问界M9品牌大使黄渤：很遗憾不能去感受现场但爱车档期不想有半点遗憾