英伟达适配 DeepSeek-V4 AI 模型，开箱性能超 150 tokens/sec/user

IT 之家 4 月 25 日消息，英伟达今天（4 月 25 日）发布博文，宣布其 NVIDIA Blackwell 平台已适配 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 两款模型，开发者可通过 NVIDIA NIM 微服务下载部署，或利用 SGLang 与 vLLM 框架进行定制化推理。

英伟达在博文指出，DeepSeek-V4-Pro 拥有 1.6T 总参数量与 49B 激活参数，定位高级推理任务；DeepSeek-V4-Flash 版本则为 284B 总参数量与 13B 激活参数，主打高速高效场景。

两款模型均支持 100 万 Token 上下文窗口与最高 38.4 万 Token 输出长度，覆盖长文本编码、文档分析等核心应用，并采用 MIT 开源协议。

实测数据显示，DeepSeek-V4-Pro 在 NVIDIA GB200 NVL72 上开箱即用性能超 150 tokens / sec / user，借助 vLLM 的 Day 0 配方，开发者可在 Blackwell B300 上快速部署。随着 Dynamo、NVFP4 及 CUDA 内核的深度优化，预期性能将进一步提升。

部署生态方面，开发者可通过 NVIDIA NIM 微服务下载部署，或利用 SGLang 与 vLLM 框架进行定制化推理。SGLang 提供低延迟、均衡及最大吞吐量三种配方；vLLM 则支持多节点扩展至 100 个以上 GPU，具备工具调用与推测解码能力。

IT 之家附上参考

DeepSeek不想只做大模型了

钛媒体 6小时前

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

英伟达适配 DeepSeek-V4 AI 模型，开箱性能超 150 tokens/sec/user

宙世代

一起剪

相关阅读

DeepSeek V4上线：八家国产芯片已火速适配！

假冒DeepSeek！全国首例AI混淆案宣判：罚款5000元

上架秒光！华为万元旗舰Pura X Max全色售罄

3DMark macOS独立版终于发布：不用苹果商店、离线也能跑

谷歌据称拟最高投资400亿美元 加深与Anthropic的合作关系

DeepSeek-V4发布，黄仁勋的担忧成真了

AMD EXPO 1.2来了！支持国产DDR5内存 新增超低延迟模式

DeepSeek不想只做大模型了

赋能汽车智能进化，商汤绝影舱驾一体全场景智能体产品亮相北京车展

北京车展首日！轻舟智航物理AI模型亮相，用超500TOPS智驾对标上千TOPS体验

舱联破界、AI随行、雷达全感：移远通信“硬核三件套”引爆北京车展

黑芝麻智能发布基于FAD 2.0平台的FAD天衍L3级自动驾驶系统

前华纳高管押注土耳其：首部合拍剧《Caged Love》开机，瞄准全球1.5亿观众市场

超级直播神器！华为随行WiFi X获UFCS认证：快充不挑充电器

中国显示器线上销量排名出炉：AOC夺冠 HKC、小米进前三

最新评论

IT之家

热门推荐

企业资讯

谷歌据称拟最高投资400亿美元加深与Anthropic的合作关系

AMD EXPO 1.2来了！支持国产DDR5内存新增超低延迟模式