APP下载

关于ZAKER

合作

ITBEAR 9小时前

智谱 GLM-5.1 大模型登顶全球开源榜首 8 小时独立编程展现硬核实力

全球开源大模型领域迎来重要突破，智谱最新推出的 GLM-5.1 大模型在多项权威评测中表现亮眼，不仅登顶全球开源模型榜首，更在真实软件开发场景中展现出超越头部商业模型的实力。

在 LMArena 平台发布的 Code Arena 专项榜单中，GLM-5.1 以显著优势领跑开源阵营，全球排名跃升至第三位。该平台通过百万用户参与的盲测机制确保数据客观性，此次排名更新标志着中国开源模型首次在代码生成领域进入全球第一梯队。值得注意的是，在持续工作能力评估中，GLM-5.1 成为唯一达到 8 小时级稳定运行的开源模型，与 Claude Opus 4.6 共同构成该领域的双雄格局。

技术突破方面，GLM-5.1 在长程任务处理能力上实现质的飞跃。研发团队公布的测试数据显示，该模型可在 8 小时内完成从零构建 Linux 桌面的复杂工程，通过 655 次算法迭代突破向量数据库优化瓶颈，并成功实现 1000 轮工具调用优化真实机器学习模型负载。这些突破性成果使其在需要持续推理的复杂任务中具备显著优势。

在衡量专业软件开发能力的 SWE-Bench Pro 基准测试中，GLM-5.1 以绝对优势刷新全球最佳纪录。该测试要求模型在真实 GitHub 仓库中定位并修复高难度工程级 Bug，被业界视为检验模型实用性的 " 终极考场 "。测试结果显示，GLM-5.1 的得分超过 GPT-5.4 和 Claude Opus 4.6 等头部商业模型，展现出开源技术在真实工程场景中的强大竞争力。

开源社区对 GLM-5.1 的开放策略给予积极响应。自正式开源以来，该模型已吸引全球开发者参与二次开发，其代码库贡献量呈现指数级增长。技术分析指出，GLM-5.1 通过创新的架构设计，在保持开源特性的同时实现了商业级性能，这种 " 开源 + 高性能 " 的组合模式正在重塑全球 AI 开发格局。

据技术白皮书披露，GLM-5.1 在继承前代模型编码优势的基础上，重点优化了上下文理解、工具调用和持续推理能力。其独特的注意力机制设计使模型能够处理超长序列输入，这在构建大型软件系统时具有关键价值。开发者测试反馈显示，该模型在处理跨文件代码修改、依赖关系管理等复杂任务时表现尤为突出。

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

企业资讯

查看更多内容

Blockchain News

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

智谱 GLM-5.1 大模型登顶全球开源榜首 8 小时独立编程展现硬核实力

宙世代

一起剪

相关阅读

拦截100万元涉诈资金成功，银行宣传“反诈胜仗”却引争议，回应来了！银行员工：反诈压力较大，“没拦住会被指责，过度拦截又易遭投诉”

东航MU6113突遇雷暴：盘旋数圈终安全降落！乘客：感谢中国机长带我回家

阿尔忒弥斯2号成功溅落太平洋！美国载人绕月任务圆满成功

借变道制造全责！网约车成碰瓷工具：46人被抓 骗局细节曝光

一觉醒来网页排版提速500倍？这个开源项目有点狠。

严贤京偷文件当场被抓，郑允拒和解直接送进拘留室

Lucy Liu为一只Birkin跟Kim Cattrall＂干

关于谈判，特朗普最新发声

车牌带8888的奔驰车做陪葬品？官方通报核查处置情况

车主称修车被误诊致多花900美元，要求退款并索要诊断记录

国产碳纤维有多牛：太空电梯或成真 3.6万公里只要50吨

抢票软件到头了？携程、同程、飞猪等7家平台被网信办约谈

油价不再是唯一变量：一座石化大市的智能转型

中央网信办、国家铁路局联合约谈7家涉火车票销售第三方平台

官方通报全红婵遭网暴：男子微信群发侮辱言论被行拘

最新评论

企业资讯

热门推荐

企业资讯

借变道制造全责！网约车成碰瓷工具：46人被抓骗局细节曝光