APP下载

关于ZAKER

Skills 合作

财联社-深度 39分钟前

押注长上下文与国产算力生态智谱凭 GLM-5.2 跻身全球大模型头部阵营？

《科创板日报》6 月 17 日讯（记者李明明）6 月 17 日，智谱发布并开源新一代旗舰大模型 GLM-5.2。

在 Artificial Analysis 综合榜单上，GLM-5.2 取得 51 分，位列开源模型 SOTA。

据智谱方面向《科创板日报》记者介绍，这是其迄今能力最强的开源模型，核心只做了两件事：即把 1M token 上下文从 " 纸面参数 " 做成 " 生产可用 "；同时把长程 Coding 能力再往前推了一步。

《科创板日报》记者第一时间对 GLM-5.2 Max 进行了数小时连续实测，任务覆盖长上下文检索与生成、Long Horizon 长程 Agent 编码，一次性完成近百万 token 复合型行业调研全链路交付等场景。

实测 GLM-5.2

据智谱方面介绍，GLM-5.2 的核心突破在于将百万级上下文窗口做到了工程可用 。

例如，模型可在一轮连续任务中处理 88 万以上 token，自主完成从开发、联调、测试到打包上线的完整软件交付流程，数小时内产出一个覆盖网页端、移动端与小程序的完整应用。而在过去，类似体量的工程通常需要一支团队协作数周。

目前市面上支持百万级上下文的模型并不少，但一个公开的秘密是很多模型在 30 万 token 之后就开始 " 丢信息 "，长文本下的推理质量呈断崖式下跌。智谱的技术方案是一组注意力结构层面的创新：KV8 量化、LayerSplit、IndexShare 4 和 HiSparse 稀疏注意力机制的组合。

从工程角度看，这组改动的目标很明确：在 1M 长度下同时压低效果衰减和推理成本。智谱官方数据显示，在 1M 上下文长度下，单位 token 的 FLOPs 降低至 2.9 倍（即相比传统方案减少了约 66% 的计算量）。

智谱在技术博客中披露了该模型的一个实测结果：模型一次性完成了覆盖 Web、移动端与小程序的完整应用开发交付，累计处理 88 万 tokens，几乎用满 1M 窗口。这意味着在真实的超长工程任务中，模型能够完整保持项目状态，而不是在第十轮对话后就忘了第三轮定下的约束。

《科创板日报》记者也实测了 GLM-5.2，实测任务要求模型基于海量公开素材完成 K12 在线编程教育竞品深度调研，横向覆盖 15 家赛道主流品牌，拆解课程、师资、定价、家长评价四大核心维度，一次性交付带溯源索引的 XLSX 数据库、20 页 PDF 完整分析报告、6 张可视化对比图表、可复用数据处理脚本全套成果。

经过半小时左右，最终模型完整留存 804 条家长评价，输出含 12 个数据分表的标准化 Excel、完整行业报告、可运行脚本，全程未出现品牌混淆、数据维度丢失、统计口径错乱等长文本模型常见问题。但 1M 上下文的极端场景仍有优化空间。

为了进一步验证模型的深度分析研究能力，《科创板日报》记者又下了一个实测指令：基于国家统计局及可公开核验的宏观数据，对 2018-2024 年中国县域消费升级开展系统化研究，构建覆盖 200+ 县域的可溯源数据库，并交付数据底表、研究报告、汇报 PPT 及配套可视化图表。

实测发现， GLM-5.2 Max 可单轮承载近百万宏观统计素材，一次性完成全国四百余县域量化数据库搭建、深度分析报告与成套可视化图表全链路交付，适配金融咨询级长周期大数据研究任务。

那么，如何将 GLM-5.2 的编程能力放在全球最头部模型中进行定位？

北京计算机学会 AI 专委会秘书长、北京大学特聘研究员张有鱼告诉《科创板日报》记者，智谱 GLM-5.2 的发布标志着国产模型在编程细分场景取得了关键性突破。

首先，打破双寡头垄断，依托登顶全球编程基准的实测表现与高性价比，GLM-5.2 在长上下文编程场景下优势显著，正在重塑行业格局，催生智谱、OpenAI、Anthropic 三方鼎立的 " 新御三家 "。

其次，虽未能实现全维度超越，但在目前多数中高频的实际开发场景下，该模型已完全可以作为海外头部模型的替代方案。" 但是核心短板仍存，在深度的数理逻辑推理与跨领域知识的复杂融合上，GLM-5.2 与海外最顶尖水平相比仍存在一定的技术代差，这是下一步需要重点攻坚的方向。"

国产算力 Day 0 适配

在性能之外，GLM-5.2 以最宽松的 MIT 协议开放，允许免费商用，且模型训练与线上推理均未依赖海外算力。

上线首日，GLM-5.2 的线上推理已在 Day 0 完成与八大国产算力平台的推理适配。这一 " 开源国模 + 国产算力 " 的组合受到行业关注。

智谱方面同时对《科创板日报》记者表示，预计下半年昇腾 950 超节点上市后，将成为 GLM-5.2 重要的算力底座。

"Day 0 适配 " 不是指模型 " 能在国产芯片上跑起来 "，而是意味着在发布当天就已经完成了深度推理适配与算子级优化——这代表国产芯片不是作为 " 备胎 " 存在，而是与海外算力平台同等对待的第一梯队底座。

智谱的适配名单覆盖了国产算力的头部企业：华为昇腾、寒武纪、摩尔线程、海光、壁仞、沐曦、昆仑芯、平头哥。既是为了分散供应链风险，也是为了最大化触达不同行业的国产化替代需求。

从商业逻辑来看，当前，国内大模型公司的算力成本中，GPU 采购和租赁占据了大头，且高度依赖英伟达 H100/H200 等海外高端芯片。而在中美科技博弈持续升级的背景下，算力供应链的自主可控已经从 " 战略储备 " 变成了 " 生存必需 "。

从开发者视角看，国产算力适配意味着两件事：一是企业用户可以在纯国产环境中私有化部署 GLM-5.2，满足数据安全和合规要求；二是当海外算力供应出现波动时，国产替代方案已经准备完善，不需要从头开始适配。

从技术角度看，在多个架构差异显著的国产芯片上完成推理适配，要求模型在算子兼容性、内存管理和推理效率方面做大量工程调优。智谱能够做到 Day 0 同步适配，表明其底层工程团队在异构计算方面已有较深积累。

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

企业资讯

查看更多内容

Blockchain News

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

押注长上下文与国产算力生态 智谱凭 GLM-5.2 跻身全球大模型头部阵营？

宙世代

一起剪

相关阅读

冰火两重天！韩国机构SpaceX IPO颗粒无收 本土散户首日狂买7.96 亿美元创历史新高

吴清：中国资产的安全+韧性+创新价值，受到国际投资者广泛关注和青睐

沪指尾盘翻红收复4100点，科技上游通胀行情持续火爆，4000亿存储龙头午后涨停

小摩：日本央行加息至1% 但“中性利率”仍无明确答案

机构抢筹多只PCB人气股，多路资金激烈博弈香农芯创

俞浩：“不循常规”的清华极客

上交所邱勇：着力打造“宽基+科创+红利”的指数体系

摩根大通：到2030年 AI基础设施建设总花费将达到5.5万亿美元

中国市场卖不动！宝马大砍2026财年预期 股价应声大跌8%

山姆中国首席采购官张青因个人原因离职

一图看懂：头部权重宽基ETF份额持续“瘦身” 最大规模通信ETF月内再吸超90亿

连锁百强风云变幻，下一个风口何在？

中美航线5月份之后全面爆舱 目前美东航线运价接近7500美元

“信贷工厂”模式基本过去，部分城商行撤销小企业金融专营机构，加速转向线上获客

安踏三年连升四级，运动品牌如何答好ESG“必答题”？

最新评论

财联社

热门推荐

企业资讯

押注长上下文与国产算力生态智谱凭 GLM-5.2 跻身全球大模型头部阵营？

冰火两重天！韩国机构SpaceX IPO颗粒无收本土散户首日狂买7.96 亿美元创历史新高

中国市场卖不动！宝马大砍2026财年预期股价应声大跌8%

中美航线5月份之后全面爆舱目前美东航线运价接近7500美元