AI 大潮汹涌,赛道既蓝且红。4 月 8 日,智谱正式发布并开源最新模型 GLM-5.1。
据科创板日报,其是唯一达到 8 小时级持续工作的开源模型,在最接近真实软件开发的 SWE-bench Pro 基准测试中,GLM-5.1 实现国产模型首超 Opus 4.6。在三个核心代码评测基准综合平均分上,取得全球模型第三、国产模型第一佳绩。
与产品迭代同步落地的是定价调整,GLM-5.1 再度提价 10%,已接近 Anthropic 旗下 Claude Sonnet 4.6 水平。
受此提振,4 月 8 日智谱股价报收 868.5 港元,年内累计上涨 647.42%,领跑港股 AI 板块,成最受资金关注的方向。同为国产大模型双雄的 MiniMax-W 也很抢眼,同期股价开年累涨 505.45%。截止 4 月 20 日智谱股价进一步升至 975 港元。
作为 "AI 六小龙 " 中率先上市的两公司,智谱、MiniMax 常被市场拿来对比,前者走 B 端深耕、技术先行之路。依托 GLM 基座模型,通过 MaaS 平台深绑政府国企等大客户,依靠技术定价权和规模化变现实现价值转化。后者则主打 C 端全球化与产品驱动,凭借 Talkie 等爆款应用开拓海外市场,用 AI 重塑内容消费方式,靠产品和用户增长讲出一套资本故事。
双雄路径不同、热度相同,折射了 AI 场景赛道的诱人前景,谁会最终胜出?又有无挑战牵绊呢?
营收翻倍、云端崛起
如果说路径选择决定了智谱 " 出身 ",那么财报数字则揭示了它的 " 转向 "。
财报显示,2025 年公司营收 7.24 亿元,同比增长 131.9%,连续三年翻倍增长,已是国内收入规模最大的大模型公司。
然依然难改亏损囧境,同期净亏 47.18 亿元,同比扩大 59.5%,经调整后净亏 31.82 亿元。核心源于研投,全年研发开支 31.8 亿元,同比增长 44.9%,相当于同期营收的 4.4 倍。
挣得远没花的多,自然难脱亏态。拆解收入结构,主要分为两大块:本地化部署和云端部署(即 MaaS),前者贡献 5.34 亿元,同比增长 102.3%,但占总收入比从 84.5% 降至 73.7%;云端部署服务收入 1.904 亿元,同比大增 292.6%,占比从 15.5% 跃至 26.3%,成为驱动公司增长的关键引擎。
类似升降的还有利润变化,2025 年智谱云端部署业务毛利率从 2024 年的 3.3% 升至 2025 年的 18.9%,主要得益于模型推理效率提升、算力规模扩张带来的边际成本递减。本地化部署业务则从 66% 下滑至 48.8%。两相抵消后,综合毛利率从 2024 年的 56.3% 降至 41.0%,这也是亏损增长的一个原因,毕竟本地化业务的庞大体量摆在那里。
好在进入 2026 年,智谱大模型产品迎来密集调价,如 2 月 12 日推出新一代旗舰模型 GLM-5,随后便针对 GLM Coding Plan 套餐调价,整体涨幅 30% 起。

即便如此,市场需求依然旺盛。据华尔街见闻,截至 2026 年 3 月 31 日公司开放平台 API 的年度经常性收入(ARR)已飙至约 17 亿元人民币(约 2.5 亿美元),较 2025 年底的约 5 亿元暴增逾 2.4 倍。
为什么涨价仍愿买单?智谱 CEO 张鹏曾以国际同行 Anthropic 为例解释称 " 当模型足够强,API 本身就是最好的商业模式。"Anthropic 的 ARR 从 2024 年底 10 亿美元,到 2025 年底 90 亿美元,再到 2026 年 4 月破 300 亿美元,说明智能质量创造定价权,深度使用创造规模效应。
最终,智谱年报用一句话总结了该逻辑:" 如果说智能上界决定了技术的定价权,那么 Token 的消耗规模则决定了商业价值的体量。" 翻译过来就是:模型越聪明,越有底气涨价;用户越离不开你,Token 消耗越大,收入天花板就越高。
上升到产业视角,智谱涨价并非孤例,而是行业变革的缩影。
互联网时代的核心度量单位是 " 字节 "(Byte),它衡量的是信息体积;进入智能时代,关键标尺正变为 " 词元 "(Token),它衡量的是智能交互深度。
从字节到 Token,用户输入 AI 的每一个字、AI 输出的每一段话,都要被拆解成 Token 来计量和计价,整个产业的价值链条重新书写。
国家数据局披露数据显示,截至 2026 年 3 月,中国日均 Token 调用量已破 140 万亿,而 2024 年初仅 1000 亿,两年增超千倍。
Token 同时连接着 AI 公司收入成本两端,既是客户为智能付费的计价单位,也是模型运行消耗算力的成本单元。当 Token 调用量成为衡量 AI 模型活跃度与产业价值的关键指标,一个新经济模式便形成了。
2026 年 3 月,智谱推出面向 OpenClaw 场景深度优化的基座模型 GLM-5-Turbo。这款模型发布后 24 小时内即获字节跳动 TRAE、阿里巴巴 Qoder、腾讯 CodeBuddy 等头部平台产品的官方接入。
在 2025 年业绩说明会上,张鹏透露 2026 年一季度智谱的 API 调用定价提升 83%,市场依然供不应求,调用量增长 400%。当前,智谱已成为国内付费 Token 消耗量最高的厂商之一。
换言之,智谱 API 业务正摆脱低价换量、以亏损换规模的早期粗放逻辑,开始具备定价权、复购和规模效应。Token 调用量高增,从日均千亿到百万亿级跨越,宣告着企业数字化转型正式从 " 流量时代 " 迈入 " 智能时代 "。

华创证券则给出更大胆的判断:2026 年是 AI Agent 元年,OpenClaw 等现象级个人 Agent 产品有望涌现,其影响力可比肩 2025 年 DeepSeek 大模型的开源时刻。此轮产业周期中,拥抱 AI 的企业将成胜出关键,而 AI-Native 厂商凭借更具攻击性的组织形态与更轻历史包袱,胜率更为凸显。
行业分析师李小敬表示,目前港股已是全球 AI 稀缺资产的价值发现地,MiniMax 与智谱作为全球唯二具备基座大模型能力的厂商,稀缺性溢价持续凸显。一个市场共识正在形成:Token 经济浪潮刚刚开始,而智谱已经站在了潮头。
的确,随着市场渐入爆发前夜,自身产品日益成熟,智谱正一点点卡住赛道 C 位、迎来收获季。
三大隐忧 涨价底气冷思
不过,这不代表无懈可击。光环越耀眼,阴影越深长,穿透 Token 量价齐升光环背后,智谱前景图里还有算力短缺、盈利承压、竞争围堵构成的多重挑战。
首先,深陷亏损泥潭、苦等盈利拐点。2025 年,智谱营收 7.24 亿,净亏 47.18 亿,亏额是收入的 6.5 倍,综合毛利率降超 15 个百分点。2022 至 2025 四年累亏逼近 85 亿元。虽然 " 烧钱 " 在大模型业并不罕见,可市场耐心毕竟有限度。如何稳住基本盘本地化部署的利润,尽快打开增量盘 API 的体量占比,都是智谱待解考题。
其次,警惕 Token 短期过热风险,涨价底气能撑多久?
当前 Token 消耗的爆发式增长,高度依赖 OpenClaw 等 AI 智能体应用。如果 Agent 无法从开发者群体渗透至普通用户,或场景落地节奏不及预期,Token 需求的增速曲线随时可能出现拐点。
聚焦到智谱,敢于涨价的重要底气是模型智能的暂时领先。然而市场一日千里,大模型业的技术代差极易被抹平,字节、阿里、腾讯正在以不计成本的方式投入研发。一旦竞争对手在模型能力上追平或反超,定价权将迅速瓦解。尤其巨头们频繁祭出 " 免费 " 策略的压制下,智谱 " 量价齐升 " 正向循环极可能逆转。
最后,股价波动暴露市场分歧。自开年 1 月上市起来,智谱股价涨势凶猛,短短三月就翻了 6 倍还多。但进入 4 月震荡开始加大,1 日单日大涨 30.93%,市值破 4100 亿港元;次日即暴跌 14.86%,蒸发 600 亿港元。4 月 14 日股价一度达到 1010 港元,次日又大跌 8.5% 至 867 港元。

行业分析师孙业文认为,API 调用量的爆发、Token 消耗的激增、ARR 的快速爬升,这些数据固然亮眼,但它们掩盖不了一个核心追问,如果明天巨头免费策略升级,如果后天 Agent 落地不及预期,智谱定价权还能撑多久?智谱需要回答的,不是 " 今天涨了多少 ",而是 " 明天凭什么继续涨 "。否则,隐忧终将不再是 " 隐 " 忧。
不算多苛求。如果说内部隐忧是智谱需自我消化的 " 成长烦恼 ",那么外部角力则是它必须正面迎击的 " 生存考验 "。以下三个挑战,每一个都不容小视。
第一个算力缺口。智谱算力较依赖第三方供应,缺乏大规模自建算力中心。2025 年起,公司从租赁设备转向直接采购算力服务。随着规模扩大,如果边际成本不能因规模化而下降,就与自建算力中心的巨头形成鲜明对比。
如据大河财立方,2 月 21 日智谱 AI 发文致歉,表达其旗舰模型 GLM-5 发布后遭遇的运营困境。2026 年初该系列发布后,用户热情远超预期,算力供应瞬间崩溃,大量付费用户无法使用核心模型。公司被迫推出高峰期 3 倍、非高峰期 2 倍的分层消耗策略。2 月 23 日,公司股价暴跌 22.76%,市值单日蒸发超 700 亿港元。
为应对困局,智谱启动了国产算力适配和 " 算力合伙人 " 计划。不过有分析提醒,与海外巨头自建算力中心实现自主可控相比,智谱在算力成本、供应稳定性及技术适配深度上均不占优势,长期或制约稳健发展。
第二个强敌环伺,竞争愈发白刃。随着新一轮技术变革的全面铺开,字节、阿里、腾讯等互联网巨头正以不计成本的姿态重注 AI 赛道。占领市场的手段更依赖 " 免费 " 策略,试图以价格换规模、以规模定生死。
在此背景下,虽贵为 " 全球大模型第一股 ",智谱仍不能松紧:前有巨头重兵堵截,后有 MiniMax、百川智能、月之暗面等创业公司步步紧逼。
面对巨头们雄厚的资金与算力储备,MiniMax 在 C 端全球化中凭借爆款构建的护城河,智谱在价格战、模型战双重夹击下,各方愈发审视其赖以立足的 " 定价权 " 叙事。
第三合规风险,数据隐私红线。国家网络与信息安全信息通报中心 2025 年 5 月通报,依据《网络安全法》《个人信息保护法》等法律法规,经公安部计算机信息系统安全产品质量监督检验中心检测,在应用宝中发现 35 款移动应用存在违法违规收集使用个人信息情况。
其中,智谱旗下产品《智谱清言》(版本 2.9.6)被列第 2 类违规情形—— " 实际收集的个人信息超出用户授权范围 "。在大模型数据监管日益收紧的背景下,此次事件暴露了公司在用户隐私保护方面的治理短板、需举一反三、防止再犯。

手握双镜、蓝海浪尖寻找锚点
若把视线拉长些,智谱故事是一场关于长期主义与短期效率的博弈。
前者要求智谱不计成本地投入研发、打磨模型、培育生态,为的是在 Token 经济终局中占据定价权制高点。后者则拷问每一分钱的去向:亏损能否换来核心壁垒?烧钱能否烧出复购?增速能否覆盖失血、继而甩开竞品?两者好似望眼镜与显微镜,只有兼具才能行稳致远。
正向看,智谱路径选择卡位精准。将筹码押注在 MaaS、Token 经济上,实质是赌一个更大的未来,当模型足够聪明,用户足够依赖,Token 就不再是成本项,而是定价权载体。长期主义的回报逻辑在于:当调用量从指数级增长回归线性增长时,定价权将决定商业厚度。
负向观,长期主义不排斥亏损,但排斥低效亏损。四年累亏近 85 亿的数字背后,核心拷问并非 " 该不该投 ",而是 " 投得准不准 "。如高昂的定制化交付成本无法通过规模化摊销,项目制增长的尽头可能是利润黑洞、恶性循环。
一句话,智谱真正价值,不在于它今天讲了一个多性感的 Token 故事,而是它能否在未来 12-18 个月内,将 ARR 的 60 倍增速转化为结构性的盈利预期。长期承诺再诱人还需眼下的一个个效率效益、一步步喜报进化来兑现——每个季度的调用量增长、每次涨价的用户留存、每笔研发投入的边际回报,都在为终局投票。只有握紧双镜,才能真正笑到最后。
开源最新模型亮相、营收持续大增、盈利更强的云端业务崛起 ...... 可喜可贺,可智谱有时间庆祝没时间停歇。找到双镜、握紧双镜,攻坚克难在路上。