先来看看本次发布的产品规格,锐炫 Pro B 系列首发共有两款产品,分别是 B50 和 B60,规格上有着不少区别。其中 B50 拥有 16 个 Xe 核心和 128 个 XMX 引擎,峰值算力可达 170 TOPS,配备 16GB DDR6 显存,显存带宽为 224GB/s,TDP 仅为 70W,并且支持 PCIe 5.0 × 8 连接,售价仅 299 美元(人民币 2156 元)。
B60 则拥有 20 个 Xe 核心和 160 个 XMX 引擎,峰值算力可达 197TOPS,并且配备 24GB DDR6 显存,显存带宽为 456GB/s,主板功耗支持在 120~200W 之间调整,同样支持 PCIe 5.0 x8 接口,售价则是 500 美元(人民币 3605 元)。
单从算力性能来看,B50 和 B60 都不算突出,即使是 B60 也就勉强摸到了 RTX 4060 的水平,但是消费级显卡本就因为采用了新的张量核心而在 AI 算力上具有优势。比如最新的 50 系显卡,即使是最低端的 RTX 5060 也有 614 的 AI 算力,与英伟达的专业计算卡 A100 差不多,前者价格只要 2499 元,后者价格则直接跳到五位数。
如果把 B50 和 B60 拿去对比英伟达的专业卡,基本可以对标 A5000 和 A4000 两款显卡,价格分别在 10000 元和 6000 元左右,分别是 B60 的三倍和 B50 的两倍多。说实话,即使有英伟达的 CUDA 生态加持,对于普通用户和小型企业来说,英特尔依然提供了更具诱惑力和性价比的选择。
自从 AI 大模型火了之后,本地部署端侧模型就成为不少 PC 爱好者的折腾方向,但是大家很快发现端侧部署 AI 大模型,面临的最大问题不是算力不足,而是 " 显存 " 不足。很多人觉得 AI 大模型的端侧体验取决于算力,其实这个看法并不完全正确,对于个人使用的本地 AI 模型来说,显存的重要性其实要更高一些。
因为显存直接决定了你可以运行多大规模的 AI 大模型,以小雷自己的 RTX 4070Ti Super 为例,显存是 16GB,那么在确保使用体验的情况下,最大可以部署 32B 参数量的模型,与满血版的 DeepSeek 有着接近 20 倍的参数量差距,基本上体验是大打折扣的。
简单来说,即使显卡的 AI 算力爆表,如果显存不足以运行大参数量的 AI 大模型,那么最终的体验都不会好,因为 AI 算力只能决定生成 token 的速度,也就是回复你的用时更短,而模型参数量则直接决定回答的质量和准确性。
反之,如果你有足够的显存去部署大参数量的 AI 模型,那么即使算力性能一般,无非就是生成回答的速度慢一些,个人使用的话忍忍也就过去了。如今的个人 AI 市场基本上处于 " 算力诚可贵,显存价更高 " 的状态,毕竟单看算力的话 RTX 5090 几乎是 A100 80G 版的两倍,前者售价三万就已经被不少人吐槽了,后者价格却接近十八万。
所以,显存的重要性应该不用小雷再过多叙述了吧?对于普通用户来说,花十几万买一张专业卡显然是不划算的,但是消费级显卡在互联协议上的阉割,让用户无法通过多卡串联来拓展显存,也就让端侧部署 AI 的体验变得十分尴尬。
为了解决显存问题,甚至出现了改装显存的 RTX 2080Ti 22G 版(原版为 11G),因为其支持完全版本的 NVLink,可以实现显存共享,按单位显存成本和算力来看,算是个人 AI 服务器里性价比最高的选择之一。
但是,在英特尔的 B50 和 B60 面世后,这些经过改装的 RTX 2080Ti 22G 版估计就要失业了,毕竟 2080Ti 本身的算力也就 130TOPS,而且改装的显存存在不稳定等隐患。作为对比,拥有 24G 显存和 197TOPS 算力的 B60 只要 3600+,而且支持 PCIe 5.0 协议下的 8 卡互联,推理和训练速度都远超老方案。
可以说,B50 和 B60 对于个人 AI 爱好者而言,无疑是真正的 " 性价比之选 ",如果不考虑模型训练效率等问题,它可以轻松让你在家里搭建一个小型 AI 服务器。
前段时间,英特尔公布了第一季度财报,报告显示,英特尔第一财季营收为 127 亿美元(约合人民币 916 亿元),与上年同期的 127 亿美元相比持平;应占净亏损为 8 亿美元(约合人民币 57 亿元),与上年同期的应占净亏损 4 亿美元(约合人民币 29 亿元)相比扩大 115%
可以说生成的压力迫使英特尔加速业务的推进,并且寻找更多的利润增长点。不过,虽然英特尔的 B50 和 B60 两款消费级 AI 显卡都有着不错的性价比,与英伟达的差距仍然没有缩小多少,巨头的订单仍然会像雪片一样涌向英伟达而不是英特尔。
无他,对于大型企业来说,价格并非关键,算力效率才是关键,因为这决定了他们能否更早完成 AI 训练,在下一轮 AI 竞赛中领先对手。
所以,英特尔显然不打算与英伟达争夺大型企业用户,而是瞄准了小型企业和个人市场。就像我前面说的那样,对于个人用户来说,锐炫 Pro B 系列显卡确实是不错的选择,对于小型工作室和企业而言也是如此。
换言之,英特尔直接把小型企业的 AI 转型门槛抹去了大半,仅留下了 " 技术问题 ",毕竟熟悉 AI 领域的人才如今都是香馍馍,想招到人手并不容易。当高昂的硬件成本不复存在,那么还有什么理由不去尝试着拥抱一下 AI 呢?
虽然小型企业的单个采购份额远不能和大型企业相比,但是从市场角度来说,小型企业的数量也是非常可观。而且英特尔可以与各种服务器供应商如浪潮、联想等合作,为企业提供一步到位的 AI 解决方案,这些基于英特尔 AI 计算卡设计的方案将因为低廉的硬件成本而更容易被客户所接受。
可以说,在英伟达忽略的市场里,英特尔正在用自己的方式为显卡业务找寻新的出路,而且真的有可能成功,对于英特尔来说,这个新的业务已是难得的增长点,必须牢牢把握住。
不过,英特尔可能并非唯一这么想的企业,AMD 也在台北国际电脑展上发布了 Radeon AI PRO R9700,这款 AI 计算卡基于消费级核心打造,拥有 32GB 的显存并最高支持四卡串联,虽然上限与英特尔有所差距,但是也有着更强的算力。
此外,还有诸如 Arm 等半导体企业,也对消费级的 AI 市场 " 虎视眈眈 ",Arm 去年就已经宣布与众多合作伙伴一起推动 Arm 架构的 AI 芯片生态发展与研发,同时开发属于自己的 AI 芯片。这些产品不仅面向服务器市场,也将面向消费级市场,依赖 Arm 架构的出色能效比,或许有一天我们可以实现小型设备上的大规模 AI 模型部署也说不定。
AI 的浪潮里,科技企业不进则退,对于已经深陷漩涡之中的半导体企业来说更是如此,谁能抓住机遇跨入下一阶段,谁就能够在未来领导这个行业。
5 月 20 日 -5 月 23 日,25 年台北国际电脑展在中国 · 台北举办。
作为全球领先的 AIoT 和新创产业大展,今年主题为 AI Next。
欢迎与雷科技一起关注台北电脑展上的 AI PC、AI 芯片、AI 硬件,一起感受扑面而来的 AI 狂潮。