英特尔“ Project Battlematrix ”软件更新：优化 AI 推理性能

英特尔在今年 5 月发布了一款可扩展且易于存取的工作站级至强平台，代号 "Project Battlematrix，" 帮助 AI 开发者解决其所面临的难题。其支持最多八块锐炫 Pro B60 24GB 显卡，实现多卡并行，拥有高达 192GB 的显存，可运行高达 1500 亿参数的中等规模且精度高的 AI 模型。英特尔希望通过简化设计，搭配经过优化的最新推理软件，加速其 GPU 与 AI 战略。

近日英特尔分享了 LLM Scaler container 1.0 版本的最新进展，对于早期客户的支持至关重要，其中包括：

vLLM 优化

针对长输入长度（>4K）的 TPOP 性能优化 - 在 32B KPI 模型上，40K 序列长度的效能提升高达 1.8 倍；在 70B KPI 模型上，40K 序列长度的效能提升高达 4.2 倍。

相比于上次发布，进行了性能优化，8B-32B KPI 模型的输出吞吐量提升约 10%。

逐层在线量化，以减少所需的显存。

vLLM 中的 PP（pipeline parallelism）支持（实验性）。

torch.compile（实验性）。

推测译码（实验性）。

支持嵌入、重新排序模型。

增强的多模态模型支持。

最大长度自动检测。

数据平行支持。

OneCCL 基准测试工具启用

XPU 管理员

GPU 功耗

GPU 固件更新

GPU 诊断

GPU 显存带宽

英特尔计划在今年第三季度末推出 LLM Scaler 的强化版本，并新增额外功能，预计第四季度发布完整的功能集。

这一板块缺货涨价！

钛媒体 2小时前

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频剪辑

AI视频剪辑

AI智能客服

AI工具箱

AI写稿助手

AI口语陪练

我的订阅

英特尔“ Project Battlematrix ”软件更新：优化 AI 推理性能

宙世代

一起剪

相关阅读

大学生无纸化学习最佳拍档，华为MatePad 11.5 S售价1685元起

你遇到没！网友吐槽苹果手机定位偏差：人在北京被定位到四川

首发天玑9500！vivo X300现身跑分网站

这一板块缺货涨价！

全新华为MatePad 11.5 S今日上架 护眼更清晰成学习新标杆

“即时零售”战火升级 ！美团京东淘宝激战正酣 抖音宣布“打法”入局

小米官方招募“广告狙击手”：测试整治各类违规弹窗广告

博主证实“轮轴比”概念不是小米发明的：至少二十多年前就有了

自带24K金箍棒！红魔10S Pro《斗战胜佛》典藏版今日预售：国补价5499元

首款能接入米家控制的充电器！酷态科10号超级电能充Ultra推送首次OTA

京东二季度财报“秀肌肉”：新业务收入同比增长199%，外卖达成初期战略目标

小米的草包时刻

温州一老板：买了小米YU7 我那特斯拉门都没打开过

零食领军品牌好想来入驻淘宝闪购 订单量连续3个月保持200%以上增速

米哈游「小天才」离职创业后，做了一家漕河泾最像硅谷的公司

最新评论

超能网

热门推荐

热门订阅 换一批

星河商业观察

硅基星芒

全新华为MatePad 11.5 S今日上架护眼更清晰成学习新标杆

“即时零售”战火升级！美团京东淘宝激战正酣抖音宣布“打法”入局

零食领军品牌好想来入驻淘宝闪购订单量连续3个月保持200%以上增速

热门订阅换一批