APP下载

关于ZAKER

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

Skills 合作

观点新媒体 1小时前

智谱披露 GLM-5 底层基建进展修复方案被 SGLang 社区采纳

观点网讯：4 月 30 日，智谱发布技术博客《Scaling Pain：超大规模 Coding Agent 推理实践》，首次系统披露 GLM-5 系列模型在超大规模 Coding Agent 调用场景下的底层推理技术突破。

据介绍，针对 Context Parallel 策略中的 KV Cache 冗余存储问题，智谱设计实现了 KV Cache 分层存储方案 LayerSplit，每张 GPU 仅持有部分层的 KV Cache，通过广播机制完成协同计算。在 Cache 命中率 90% 条件下，40K 至 120K 请求长度区间内，系统吞吐量提升 10% 至 132%，且上下文越长收益越显著。

信息显示，智谱团队不仅在自有推理链路中定位并修复了 PD 分离架构下的 KV Cache 跨节点复用竞态，更在开源推理框架 SGLang 源代码层面修复了 HiCache 模块的加载时序缺失问题，修复方案已被 SGLang 开源社区采纳。

免责声明：本文内容与数据由观点根据公开信息整理，不构成投资建议，使用前请核实。

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

相关阅读

决不让消费者当冤大头！市监总局严打网络食品销售虚假宣传乱象

21世纪经济报道 2小时前

英国国王查尔斯访美

北京商报 10小时前

密集进京开店翻红的平价自助如何长红

北京商报 10小时前

北京“两新”政策实施加速跑

北京商报 10小时前

榴莲价格大降：爱吃榴莲的有福了

快科技 10小时前

阿联酋退群欧佩克式微国际油价或陷长期动荡

21世纪经济报道 10小时前

谁能把犯罪凶杀剧拍成美食风光片？

网易娱乐 29分钟前

中国卡牌首次亮相国际书展卡游“印制精品”走进哥伦比亚

中国网财经 1小时前

和讯信息郭旭光：投资赚钱？快慢指标结合起来

和讯网 2小时前

现象级短剧，能为城市文旅带来什么

网易娱乐 4小时前

触乐怪话：不要还是要咬断我的线

触乐网 11小时前

身份证照片千万不要直接发：你的个人信息可能正在被盗用

快科技 12小时前

市监总局严打“剧本式”“演戏式” 虚假营销保健食品行为

21世纪经济报道 12小时前

美团小黄蜂配送机器人落地重庆江北机场：外卖10分钟送到登机口

快科技 13小时前

产业工人代表谈AI影响：重体力活可轻松完成，带来实打实的好处

21世纪经济报道 13小时前

最新评论

没有更多评论了

企业资讯

订阅

觉得文章不错，微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容

Blockchain News