关于ZAKER 合作
36氪 12小时前

华为发布 AI 推理创新技术 UCM

8 月 12 日,华为正式发布 AI 推理创新技术 UCM(推理记忆数据管理器)。据了解,作为一款以 KV Cache 为中心的推理加速套件,UCM 融合了多类型缓存加速算法工具,分级管理推理过程中产生的 KV Cache 记忆数据,可扩大推理上下文窗口,实现高吞吐、低时延的推理体验,降低每 Token 推理成本。该技术已率先在中国银联 " 客户之声 "" 营销策划 "" 办公助手 " 三大业务场景中,开展智慧金融 AI 推理加速应用试点,并已取得成果。此外,华为计划于 2025 年 9 月正式开源 UCM,届时将在魔擎社区首发。(证券时报)

相关标签
36氪

36氪

让创业更简单

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容