上周 DeepSeek-V3.1 正式发布,主要变化包括了引入混合推理架构(一个模型同时支持思考模式与非思考模式)、提供更高的思考效率(能在更短时间内给出答案)、更强的 Agent 能力(在工具使用与智能体任务中的表现有较大提升)。
英特尔宣布,Gaudi 2E AI 加速器现已为 DeepSeek-V3.1 提供深度优化支持。凭借出色的性能和成本效益,Gaudi 2E 以更低的投入、更高的效率,实现从模型训练的深度突破到推理部署的实时响应,为大模型的加速落地提供新选择。
实测数据显示,在英特尔 Gaudi 2E 的支持下,DeepSeek-V3.1 无论是在问答还是编码上,能力都有着显著提升:在部署了 8 张英特尔 Gaudi 2E 的一体机服务器上运行 DeepSeek-V3.1 模型,在输入 / 输出 token 长度均为 1k、多用户并发数为 30 的条件下,每个并发 token 生成速率达到每秒 10 token;在输入 / 输出 token 长度均为 2k、多用户并发数为 28 的条件下,每个并发 token 生成速率达到每秒 10 token。
通过开放的架构、强大的技术支持和紧密的生态合作,英特尔将持续赋能 AI 产业的创新与发展,加速 AI 大模型技术的普惠落地。