采用华为昇腾国产算力,价格大幅下调,性能比肩顶级闭源模型,DeepSeek V4 终于来了!

DeepSeek V4 拥有 Pro 与 Flash 两个版本模型,分别对应网页端 /App 上的 " 专家模式 " 与 " 快速模式 "。

DeepSeek V4 Flash 的参数达到 284B,激活参数 13B,预训练数据 32T,上下文长度同样达到 1M。
那么 DeepSeek V4 的性能表现如何呢?根据 DeepSeek 公布的测试数据:
在 Agent 能力方面,DeepSeek V4 Pro 在 Agentic Coding 测评中,是开源模式中最佳水平,交付质量接近 Opus 4.6 非思考模式,与 Opus 思考模式还存在一定差距。

而在推理性能方面,DeepSeek V4 Pro 在已公开评测的开源模型中排名第一。

不过 DeepSeek 表示,受限于高端算力,目前 Pro 的服务吞吐十分有限,预计下半年昇腾 950 超节点批量上市后,Pro 的价格还会大幅下调。

虽然发布比大家想象中要更晚一些,但是 DeepSeek V4 的意义还是比较重大的,它意味着国产顶级开源大模型在推理环节已经摆脱对英伟达 GPU 的依赖。