关于ZAKER Skills 合作
文汇 11分钟前

黄仁勋发布“智能体电脑”背后的商机:数据不出机,Token 全免费

本月初,英伟达创始人黄仁勋发布全球首款专为个人 AI 智能体(AI Agent)打造的 Windows PC(个人电脑)超级芯片—— RTX Spark。这一发布被视为 PC 行业自上世纪 90 年代 Windows 图形界面普及以来最具颠覆性的变革,黄仁勋甚至称其为 "40 年来个人电脑的首次彻底重新设计与再造 "。

或许现在断言 PC 已被颠覆为时尚早,但可以预见的是,PC 的定义正在松动。一位资深业内人士告诉记者,当前硬件厂商正全力捕捉 AI 机遇,新设计层出不穷,端侧生态呈现勃勃生机。

改变 40 年来的电脑架构

RTX Spark 并非英伟达的 " 单打独斗 ",而是集结全球科技产业最强生态联盟的成果,该芯片由英伟达与联发科联合设计,采用台积电 3 纳米工艺制造,微软则深度参与系统层面的协同优化。

黄仁勋展示 RTX Spark 超级芯片。发布会视频截图

这块芯片并非传统意义上的独立 CPU 或 GPU,而是一颗高度集成的系统级芯片(SoC),其核心架构遵循 " 异构融合 " 理念,将原本分散在 PC 主板上的多个核心组件整合进单一芯片。其最颠覆性的技术创新在于统一内存架构——传统 PC 采用 CPU(中央处理器)系统内存与 GPU(图形处理器)显存分离的设计,数据需在两者间反复搬运,造成延迟和功耗损耗,而 RTX Spark 让 CPU 与 GPU 共享最高 128GB 的内存池,通过英伟达自研第二代互联技术实现最高 600GB/ 秒的片内带宽。这种设计彻底消除了数据搬运瓶颈,使 GPU 可直接访问大容量系统内存,为运行超大型 AI 模型提供关键支撑。

英伟达官方给出了 RTX Spark 在多个核心场景下的性能指标:本地运行 1200 亿参数大语言模型,支持 100 万 token(词元)上下文;以 1440p/100FPS 运行 3A 游戏;流畅编辑 12K 4 ∶ 2 ∶ 2 视频。其中,1200 亿参数模型的本地运行能力尤为关键——用户无需网络连接、无需支付云端费用,即可在笔记本上运行相当于 GPT-3.5 级别的大语言模型,支持整本长篇小说或数百页专业文档的上下文处理。

从 " 操作软件 " 到 " 表达需求 "

黄仁勋在演讲中提到 AI 电脑与传统电脑的核心区别:" 过去 40 年里,大家开启应用、点击、输入命令来完成工作。有了 RTX Spark,用户只要提出需求,剩下的交给 PC 来完成。"

这意味着电脑设计理念的转向,过去电脑始终围绕 " 人 " 来设计,而未来人们开始为 AI 智能体设计电脑。数字经济学者刘兴亮表示,人们要从 " 会操作 " 转变为 " 会表达 ",未来个人最重要的能力可能会变成提问、判断、创造与决策。

回想不久前几乎同时发生的 " 龙虾 "(OpenClaw)安装潮与卸载潮,其背后原因正是不可控的 token 账单和对安全的担忧。大模型的本地部署完美规避了这两个痛点—— 1200 亿参数模型直接在本地运行,数据不出机,次数不限且无需付费。

事实上,从 2023 年起,市场上就已出现 AI PC 产品,但为何业内将今年视为 AI PC 元年?其关键在于消费者的付费意愿。早期 AIPC 算力仅为 10 — 40 TOPS(每秒万亿次运算),只能运行 70 亿参数以下的小模型,实用性有限;后续产品算力提升至 40 — 60 TOPS,可运行 130 亿— 300 亿参数模型,但 AI 仍像插件。而 RTX Spark 从芯片架构层面专为 AI Agent 设计,具备 1 PetaFLOP(相当于 500TOPS)的本地 AI 算力,支持 1200 亿参数大模型——对普通消费者而言,在 PC 上使用大模型的体验已与云端相差无几,且更安全、无需为 token 付费,因此,购买意愿显著增强。

市场已迅速给出反应:RTX Spark 发布当日,英伟达股价上涨 6.26%,ARM 大涨 15.73%,而英特尔和高通分别下跌 4.67% 和 8.78%。

让 " 满血 " 大模型在本地跑起来

黄仁勋此次的发布让一家名为后摩智能的中国芯片企业十分兴奋,此前,他们正苦于如何说服市场接受把大模型搬到终端上,RTX Spark 的设计思路与他们的 M50 芯片不谋而合,即谁能让更接近 " 满血 " 的大模型在电脑上跑起来,谁就拥有定义整个 AI PC 品类游戏规则的能力。

英伟达的做法是把 CPU 和 GPU 集成在一块芯片上,后摩智能 M50 则是一块存算一体架构芯片。它们的共同点在于,都是通过架构创新,让 AI 算力从附属功能升级为芯片核心主导能力。

联想发布 AI 主机 P7

上个月,联想发布搭载后摩智能 M50 芯片的 AI 主机 P7,可在仅手掌大小的机身内流畅运行最高达 1220 亿参数的本地大模型。后摩智能 PC 业务销售副总裁倪晓林说,M50 是专为大模型推理设计的高效芯片,能以 10 瓦的低功耗实现 160TOPS 的高算力,结合大内存和高带宽,完美契合本地部署对低功耗和高性能的双重需求。

不久前,上海 " 一人公司 " 聊趣智能联手后摩智能打造了一款支持全息交互的个人智算中心,它可以梳理日程、整理纪要、陪练对话。该产品已在黄浦区养老院落地,老人们能与远在外地的家人通过全息数字形象互动。

聊趣智能联手后摩智能打造的全息交互的个人智算中心。

某 NAS(网络存储器)公司也希望成为下一代家庭中枢入口。他们希望借助 M50 上集成的大模型能力,调动存储在 NAS 中的个人数据,使其作为个人数据中心发挥更大作用。

中国信通院的数据显示,2026 年一季度,国内 AI PC 渗透率达 42%,同比暴涨 380%。我们既可以静待今年秋季 " 改变规则 " 的 AI PC 上市,也可以期待各类智能终端产品的百花齐放。

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容