关于ZAKER 合作
科创板日报 29分钟前

3000 亿港元 AI 巨头发力 AI 编程 公开 GLM-5 技术细节

《科创板日报》2 月 24 日讯(记者 李明明)2026 年开年,本土大模型企业智谱在资本市场和技术创新领域双双实现突破。

今日,港股 AI 应用板块走强,智谱股价涨超 15%,市值突破 3000 亿港元。而在春节后港股首个交易日(2 月 20 日),智谱股价市值一度攀升至 3232 亿港元,超越京东、快手等传统互联网巨头,跃居港股 TMT 板块市值第一梯队。消息面上,OpenRouter 最新周度数据显示,平台前十模型总 token 量约 8.7 万亿,中国模型独占 5.3 万亿,占比 61%。当周 token 调用量前三模型均为国产大模型,分别为 Minimax M2.5、Kimi K2.5、GLM-5。

技术层面,智谱近期发布的 GLM-5 大模型正被广泛应用,并引发全球关注。智谱最新发布的技术报告详细解读了 GLM-5 的核心架构与突破,指出该模型在真实世界编程任务中展现出前所未有的能力,在处理端到端软件工程挑战方面,全面超越此前所有开源基线模型。

GLM-5 的发布亦在全球 AI 行业和资本市场引起反响。硅谷顶级风投机构 a16z 将其与闭源模型 Claude Opus 系列对标;多项公开基准测试中,GLM-5 均位列全球开源模型第一,成为中国大模型跻身全球第一梯队的案例。

在智能体工程(Agentic Engineering)领域,以智谱为代表的国内创业企业已在核心技术与开源生态上形成局部突破,在垂直场景落地方面展现出显著优势。

为进一步验证 GLM-5 的真实技术实力,《科创板日报》记者对该模型进行了专项实测,覆盖工业级后端开发、长步骤复杂任务规划等多个核心场景。从辅助编程的 " 副驾驶 " 角色,到可独立执行的 " 总工程师 " 能力,实测结果最终印证了 GLM-5 作为开源模型 SOTA(State-of-the-Art)的水平。

从 Vibe Coding 到 Agentic Engineering,重新定义 AI 编程的未来

智谱方面告诉《科创板日报》记者,GLM-5 的核心定位,是推动全球 AI 编程范式从 "Vibe Coding"(氛围编程)全面转向 "Agentic Engineering"(智能体工程),这也是其区别于行业内其他模型的核心差异化价值。

由前特斯拉 AI 负责人、OpenAI 创始成员 Andrej Karpathy 提出的 "Agentic Engineering"(智能体工程),正成为全球 AI 产业的核心竞争赛道。作为 AI 工程范式的高阶迭代形态,该技术通过标准化工程体系,将具备自主规划、执行、纠错能力的 AI 智能体转化为可稳定落地的企业级生产力工具,重构了传统 AI 应用的开发逻辑。

目前,Agentic Engineering 领域全球产业格局已初步成型,微软、OpenAI、谷歌 DeepMind 凭借全栈技术布局与行业标准定义权稳居头部,Anthropic、英伟达等企业在细分领域领跑。

一位大模型领域工程师对《科创板日报》记者分析,中国企业正成为该领域全球第二大创新极。国内头部互联网大厂已完成全栈技术布局,以智谱为首的多家创业公司在核心技术、开源生态上实现局部突破,垂直场景落地优势显著。业内普遍认为,"Agentic Engineering" 将成为未来数年 AI 产业竞争的核心战场。

在 GLM-5 之前,行业主流的 AI 编程仍处于 "Vibe Coding" 时代:AI 本质上是程序员主导的辅助工具,开发者需要凭借经验与直觉,通过提示词引导 AI 完成代码补全、片段生成等碎片化任务,AI 始终是‘副驾驶’,不仅高度依赖人力介入,更难以处理长周期、多步骤的系统性工程任务。

" 而 GLM-5 则打破了这一格局,将 AI 推向了 "Agentic Engineering" 的全新时代:AI 不再只是代码生成工具,而是能够自主承担端到端软件工程的‘虚拟工程师’,可以 7 × 24 小时不间断运行,自主完成需求拆解、架构设计、代码编写、调试迭代、项目维护等全流程开发任务,彻底释放 AI 在复杂开发场景中的生产力。"

这一范式跃迁并非概念炒作,而是有实打实的能力与案例支撑。

在正式发布前,GLM-5 的匿名测试版本 Pony Alpha 便已在海外开发者社区 OpenRouter 登顶热度榜,开发者们震惊地发现,这个神秘模型能在完全无人干预的情况下,自主读取复杂错误日志、跨文件修复底层代码漏洞,甚至耗时数天从零构建出可用的 C 语言编译器,还有开发者用它完成了从前后端架构设计到打包签名的全流程应用开发,直接将 APP 送上应用商店。

在全球权威的真实编程任务评测 SWE-bench Verified 中,GLM-5 取得了 77.8% 的高分,位列开源模型第一,多项指标直接对标闭源天花板 Claude Opus 系列,在处理端到端软件工程挑战方面超越了此前所有开源基线。

GLM-5 的出现,也改变了全球大模型市场的格局——此前只有闭源头部模型敢触碰的 Agentic Engineering 领域,如今被开源的中国模型率先突破,也让全球市场看到了开源大模型的全新上限。

硅谷顶级风投机构 a16z 近期发布的行业报告指出,开源大模型与顶级闭源模型之间的能力差距,正在以肉眼可见的速度快速收窄,而报告中被拿来与闭源天花板 Claude Opus 4.6 正面对标的,正是来自智谱的开源模型 GLM-5。

春节期间,GLM-5 受到海外开发者社区关注。

记者实测 GLM-5:自主执行的 " 总工程师 "

为验证智谱 GLM-5 大模型的真实技术实力,《科创板日报》记者对其开展专项实测:全栈开发方面,以‘资深全栈工程师 + 视觉设计师’的双重身份设定,要求其从 0 到 1 创建可直接部署、名为「MonoGlass Gallery」的个人摄影作品集网站,明确要求采用奶油白 + 玻璃拟态 + 柔和暖灰的浅色体系,风格高级简约、拒绝模板化。

仅数分钟,GLM-5 便完整生成了适配建筑、自然与人像摄影的专业作品集网站,同步输出了符合要求的全页面设计与可部署前后端代码。

紧接着,记者还聚焦企业级 MLOps 架构规划与 Excel 交付的核心需求,验证其在专业技术场景下的落地能力。

实测任务为要求 GLM-5 以资深 MLOps 架构师身份,完成云原生编排与传统容器化方案的对比分析,输出包含工具评估、部署路线、风险评估的 Excel 工作簿。

从结果来看,GLM-5 对复杂技术需求的拆解能力表现突出:不仅精准区分了 Cloud Native Buildpacks、Tekton 与传统 Dockerfile 的技术差异,还围绕模型版本管理、自动化训练触发、持续部署标准构建了完整的战略规划。

智谱方面对《科创板日报》记者总结,智谱 GLM-5 实现了四大突破:

1. Slime 异步强化学习基建:解耦推理生成与模型训练,实现异步并行与高并发轨迹生成,极致提升 GPU 利用率与后训练效率,为智能体训练筑牢底层支撑;

2. AgentRL 异步智能体强化学习算法:中国原创核心算法,适配复杂长程交互学习,优化模型动态环境下的规划执行能力,是 GLM-5 超越开源基线的关键,为全球智能体训练提供中国方案。

3. DSA 稀疏注意力机制:结合 MoE 架构,在保留 200K 超长上下文能力的同时,大幅降低长序列计算与推理成本,支撑智能体全天候规模化落地;

4. 全栈国产芯片适配: GLM-5 完成了与华为昇腾、摩尔线程等七大国产算力平台的全栈深度优化,单节点性能媲美双 GPU 集群,长序列处理成本降低 50%,实现了旗舰级大模型在国产算力生态上的高效落地。这一突破,不仅打破了海外算力生态对大模型发展的垄断,更让中国企业能够基于完全自主可控的技术栈,构建属于自己的 AI 智能体应用,为中国 AI 产业的长期安全发展筑牢了根基。

相关标签

相关阅读

最新评论

没有更多评论了
科创板日报

科创板日报

上交所科创板电报,股市行情报道

订阅

觉得文章不错,微信扫描分享好友

扫码分享