智谱发布 GLM-5.1：将大模型能力从短时交互延伸至 8 小时级自治工程任务

【太平洋科技快讯】智谱 AI 正式推出旗舰开源大模型 GLM-5.1，该模型可独立完成最长 8 小时的长程自治任务，在多项代码基准测试中实现国产模型领先。

伴随 GLM-5.1 发布，智谱对 GLM 系列价格上调 10%。调价后，Coding 场景缓存 Token 价格接近 Claude Sonnet4.6，成为国产大模型首次在核心场景与海外头部厂商实现定价对齐。

8 小时持续工作，代码性能超越 Opus 4.6

GLM-5.1 定位为长程任务智能体，可在单次任务中自主规划、执行与迭代，连续稳定工作超 8 小时，官方介绍称是目前唯一达到该水平的开源模型。该模型在 SWE-bench Pro 测试中刷新全球成绩，超越 GPT-5.4 与 Claude Opus 4.6，实现国产模型在该硬核指标上的首次突破。

在 Terminal-Bench 2.0、NL2Repo 等代码评测中，GLM-5.1 位列国产及开源模型第一，具备高质量工程开发与系统优化能力。

可完成系统构建、数据库优化等高阶工程任务

8 小时构建 Linux 桌面：全自动执行 1200 余步操作，完成窗口管理器、状态栏、应用生态等完整功能交付，等效 4 人团队一周工作量。

向量数据库优化：经 655 轮自主迭代，将查询吞吐从 3108 QPS 提升至 21472 QPS，性能提升约 6.9 倍。

主动的系统优化器：在 KernelBench 测试中实现 3.6 倍平均加速，显著优于传统 torch.compile 方案，支持 CUDA 与 Triton 内核深度调优。

延长有效工作窗口

GLM-5.1 重点优化长时任务稳定性，可在优化收益停滞时主动分析瓶颈、切换技术路径，而非重复增量调整。该模型解决了传统模型在数千次工具调用后出现的执行漂移问题，在无明确量化指标的场景中仍具备自我评估与持续改进能力。

智谱表示，该模型为全自治智能体（ 7 × 24 小时自治运行）奠定基础，后续将持续在自我评估、上下文一致性等方向迭代。

宇树科技和阿里将有出海战略级合作：宇树机器人上手阿里电脑打字或将落地速卖通

快科技 1小时前

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

智谱发布 GLM-5.1：将大模型能力从短时交互延伸至 8 小时级自治工程任务

宙世代

一起剪

相关阅读

售价近700元！戴森发布手持无叶风扇：续航长达6小时

宇树科技和阿里将有出海战略级合作：宇树机器人上手阿里电脑打字 或将落地速卖通

全球最强游戏CPU！AMD锐龙9 9950X3D2价格官宣大涨30%：准备好钱包

鹿客真AI智能锁V7 Max明天发布：全球首发隔空充电！无限续航

iPhone 18 Pro简化相机键功能：被吐槽华而不实 苹果近年来最具争议的设计

总投资20亿元！又一半导体光芯片项目签约：年产值超10亿元

淘天一年卖了上千亿，年轻人为什么要靠玩具潮玩 “续命”？

Pro档唯一双2亿旗舰来了！OPPO Find X9s Pro外观偷跑

小马智行在克罗地亚启动欧洲首个商业化Robotaxi服务

思特威发布1.3MP车规级CMOS图像传感器SC126AT，计划2026年Q2量产

雷诺集团推出充电新品牌“Plug Inn”，4月起在法国快充站启用

“四大天王”合力，深圳拿下全球消费级3D打印九成市场

GPT-6如果只是吊胃口，那OpenAI就真会掉下悬崖了

李佳琦哽咽宣布将短暂退出直播，账号粉丝超3300万

厚度仅0.94毫米！超薄仿生相机能实现140°超宽视角

最新评论

太平洋科技

热门推荐

企业资讯

热门订阅 换一批

医线Insight

银莕财经

GMIF创新观察

中保新知

局市

挖贝网

宇树科技和阿里将有出海战略级合作：宇树机器人上手阿里电脑打字或将落地速卖通

iPhone 18 Pro简化相机键功能：被吐槽华而不实苹果近年来最具争议的设计

热门订阅换一批