关于ZAKER Skills 合作
财联社-深度 39分钟前

押注长上下文与国产算力生态 智谱凭 GLM-5.2 跻身全球大模型头部阵营?

《科创板日报》6 月 17 日讯(记者 李明明)6 月 17 日,智谱发布并开源新一代旗舰大模型 GLM-5.2。

在 Artificial Analysis 综合榜单上,GLM-5.2 取得 51 分,位列开源模型 SOTA。

据智谱方面向《科创板日报》记者介绍,这是其迄今能力最强的开源模型,核心只做了两件事:即把 1M token 上下文从 " 纸面参数 " 做成 " 生产可用 ";同时把长程 Coding 能力再往前推了一步。

《科创板日报》记者第一时间对 GLM-5.2 Max 进行了数小时连续实测,任务覆盖长上下文检索与生成、Long Horizon 长程 Agent 编码,一次性完成近百万 token 复合型行业调研全链路交付等场景。

实测 GLM-5.2

据智谱方面介绍,GLM-5.2 的核心突破在于将百万级上下文窗口做到了工程可用

例如,模型可在一轮连续任务中处理 88 万以上 token,自主完成从开发、联调、测试到打包上线的完整软件交付流程,数小时内产出一个覆盖网页端、移动端与小程序的完整应用。而在过去,类似体量的工程通常需要一支团队协作数周。

目前市面上支持百万级上下文的模型并不少,但一个公开的秘密是很多模型在 30 万 token 之后就开始 " 丢信息 ",长文本下的推理质量呈断崖式下跌。智谱的技术方案是一组注意力结构层面的创新:KV8 量化、LayerSplit、IndexShare 4 和 HiSparse 稀疏注意力机制的组合。

从工程角度看,这组改动的目标很明确:在 1M 长度下同时压低效果衰减和推理成本。智谱官方数据显示,在 1M 上下文长度下,单位 token 的 FLOPs 降低至 2.9 倍(即相比传统方案减少了约 66% 的计算量)。

智谱在技术博客中披露了该模型的一个实测结果:模型一次性完成了覆盖 Web、移动端与小程序的完整应用开发交付,累计处理 88 万 tokens,几乎用满 1M 窗口。这意味着在真实的超长工程任务中,模型能够完整保持项目状态,而不是在第十轮对话后就忘了第三轮定下的约束。

《科创板日报》记者也实测了 GLM-5.2,实测任务要求模型基于海量公开素材完成 K12 在线编程教育竞品深度调研,横向覆盖 15 家赛道主流品牌,拆解课程、师资、定价、家长评价四大核心维度,一次性交付带溯源索引的 XLSX 数据库、20 页 PDF 完整分析报告、6 张可视化对比图表、可复用数据处理脚本全套成果。

经过半小时左右,最终模型完整留存 804 条家长评价,输出含 12 个数据分表的标准化 Excel、完整行业报告、可运行脚本,全程未出现品牌混淆、数据维度丢失、统计口径错乱等长文本模型常见问题。但 1M 上下文的极端场景仍有优化空间。

为了进一步验证模型的深度分析研究能力,《科创板日报》记者又下了一个实测指令:基于国家统计局及可公开核验的宏观数据,对 2018-2024 年中国县域消费升级开展系统化研究,构建覆盖 200+ 县域的可溯源数据库,并交付数据底表、研究报告、汇报 PPT 及配套可视化图表。

实测发现, GLM-5.2 Max 可单轮承载近百万宏观统计素材,一次性完成全国四百余县域量化数据库搭建、深度分析报告与成套可视化图表全链路交付,适配金融咨询级长周期大数据研究任务。

那么,如何将 GLM-5.2 的编程能力放在全球最头部模型中进行定位?

北京计算机学会 AI 专委会秘书长、北京大学特聘研究员张有鱼告诉《科创板日报》记者,智谱 GLM-5.2 的发布标志着国产模型在编程细分场景取得了关键性突破。

首先,打破双寡头垄断,依托登顶全球编程基准的实测表现与高性价比,GLM-5.2 在长上下文编程场景下优势显著,正在重塑行业格局,催生智谱、OpenAI、Anthropic 三方鼎立的 " 新御三家 "。

其次,虽未能实现全维度超越,但在目前多数中高频的实际开发场景下,该模型已完全可以作为海外头部模型的替代方案。" 但是核心短板仍存,在深度的数理逻辑推理与跨领域知识的复杂融合上,GLM-5.2 与海外最顶尖水平相比仍存在一定的技术代差,这是下一步需要重点攻坚的方向。"

国产算力 Day 0 适配

在性能之外,GLM-5.2 以最宽松的 MIT 协议开放,允许免费商用,且模型训练与线上推理均未依赖海外算力。

上线首日,GLM-5.2 的线上推理已在 Day 0 完成与八大国产算力平台的推理适配。这一 " 开源国模 + 国产算力 " 的组合受到行业关注。

智谱方面同时对《科创板日报》记者表示,预计下半年昇腾 950 超节点上市后,将成为 GLM-5.2 重要的算力底座。

"Day 0 适配 " 不是指模型 " 能在国产芯片上跑起来 ",而是意味着在发布当天就已经完成了深度推理适配与算子级优化——这代表国产芯片不是作为 " 备胎 " 存在,而是与海外算力平台同等对待的第一梯队底座。

智谱的适配名单覆盖了国产算力的头部企业:华为昇腾、寒武纪、摩尔线程、海光、壁仞、沐曦、昆仑芯、平头哥。既是为了分散供应链风险,也是为了最大化触达不同行业的国产化替代需求。

从商业逻辑来看,当前,国内大模型公司的算力成本中,GPU 采购和租赁占据了大头,且高度依赖英伟达 H100/H200 等海外高端芯片。而在中美科技博弈持续升级的背景下,算力供应链的自主可控已经从 " 战略储备 " 变成了 " 生存必需 "。

从开发者视角看,国产算力适配意味着两件事:一是企业用户可以在纯国产环境中私有化部署 GLM-5.2,满足数据安全和合规要求;二是当海外算力供应出现波动时,国产替代方案已经准备完善,不需要从头开始适配。

从技术角度看,在多个架构差异显著的国产芯片上完成推理适配,要求模型在算子兼容性、内存管理和推理效率方面做大量工程调优。智谱能够做到 Day 0 同步适配,表明其底层工程团队在异构计算方面已有较深积累。

相关标签

相关阅读

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容