文 | 半导体产业纵横
当 2025 年被业界冠以 " 边缘生成式 AI 元年 " 之名时,半导体产业正经历着自移动互联网时代以来最剧烈的底层架构变革。在这场由智能终端设备、工业物联网和实时决策需求共同驱动的技术革命中,传统算力分配模式遭遇根本性挑战。IDC 数据显示,全球边缘 AI 芯片市场规模在 2025 年 Q1 同比增长 217%,其增长速度远超云端 AI 芯片市场。在这场变革中,GPU、NPU、FPGA 三大架构呈现出迥异的演化路径,背后的技术哲学差异折射出半导体企业对未来计算范式的不同判断。
GPU
在过去几年以大模型为核心的 AI 浪潮中,通用 GPU 凭借其强大的稀疏计算能力和可编程性脱颖而出。然而,边缘硬件不仅要处理单一模型的推理任务,还需对设备上的所有分支加速任务、用户交互任务以及设备管理任务进行处理。因此,AI 边缘设计需要从全局视角出发,确保 AI 场景能够与其他功能共存。更重要的是,随着性能提升和晶体管密度增加,还必须进行热分配和热管理,这是新出现的关键问题。在未来的边缘 AI 应用中,每瓦算力(TOPS/W)将比绝对算力(TOPS)更为重要。
另一个在大模型应用中得到验证的重要规律是,AI 模型和算法领域始终处于快速变化与演进之中。硬件设计者需要通过提升加速器的能效和可编程设计能力,确保其设备能够满足未来的需求。此外,终端 / 边缘设备及应用的多样性也是关键因素。硬件设计不仅要适配当前流行的模型和特定应用,还需支持下一代模型以及快速变化的应用需求。这需要软硬件协同配合,目前软件内容应具备适应未来发展的能力,突破针对特定模型或应用开发加速器的限制,这对于产品推出速度更快的中国大陆系统厂商及其主芯片供应商而言极其重要。
GPU 作为执行各类任务的优秀加速器,在云端 AI 工作负载中展现出卓越的性能、可扩展性和可编程性。近期,Imagination 公司最新推出的 E 系列 GPU IP,通过两大核心创新——神经核(Neural Cores)和爆发式处理器(Burst Processors),将 INT8/FP8 算力扩展至 200 TOPS,较前代性能提升 400%,同时功耗效率提升 35%。
IDC 研究总监 Phil Solis 表示:" 各类设备上的 AI 功能正在迅速演进,但 AI 系统设计者依然面临性能、效率与灵活性的多重挑战。Imagination 凭借其长期深耕低功耗 GPU 的经验,成功实现了 GPU 架构对图形与 AI 的灵活支持。E-Series 结合了 GPU 的可编程性与 AI 性能的飞跃,为边缘智能(Edge AI)系统开发者带来了极具吸引力的解决方案。"
NPU
随着 AI 应用加速从云端向边缘延伸,CPU、GPU 等传统处理器逐渐暴露出在功耗、延迟及资源利用上的局限性。专为应对这些挑战而生的神经处理单元(NPU),在边缘计算领域的价值日益凸显。NPU 深度聚焦 AI 模型推理阶段的加速优化,区别于通用型 CPU 和兼顾多任务处理的 GPU,它通过消除冗余处理环节,显著提升 AI 任务的执行效率,在对象检测、语音识别、异常监控等实时性要求极高的应用场景中表现尤为突出。
同时,NPU 在功率与性能的平衡上展现出独特优势,能够以较低功耗实现高性能 AI 运算,这种特性使其特别适配于散热条件有限、能耗管控严格或空间紧凑的边缘设备,包括无风扇计算机、嵌入式物联网系统以及工业自动化控制器等。
此外,NPU 让设备端本地 AI 处理成为可能,有效降低了对云端算力的依赖,大幅减少数据传输延迟,同时强化了数据隐私保护。凭借并行计算架构与小型化设计,NPU 得以灵活部署于智慧城市、智能监控、移动机器人、自动驾驶等多样化场景,为边缘智能的规模化落地与持续拓展提供核心驱动力。
NPU 的核心优势在于能效比与任务专一性。例如,NXP 的 i.MX 95 系列处理器集成 eIQ Neutron NPU,算力 2 TOPS,在图像识别任务中较前代速度提升四倍,同时功耗降低 30。这种特性使其在智能安防、医疗设备等对实时性要求苛刻的场景中占据主导地位。
FPGA
FPGA 以其可重构特性,在边缘 AI 中扮演了独特角色。2025 年 4 月,英特尔旗下 Altera 独立后,宣布将重点布局边缘 AI 推理市场。FPGA 的并行处理能力与低延迟特性,使其适合需要快速迭代算法的场景。
并行处理是 FPGA 与 GPU 的共同优势,但 FPGA 能在更细粒度逻辑单元级别并行计算。对于 8K 视频这类数据量巨大的处理任务,CPU 指令串行处理难以胜任,GPU 多核渲染也存在局限,而 FPGA 可将视频流程分阶段处理,实现像素级并行。如诺亚星云 MX2000 pro 显示控制器采用 AMD 的 FPGA,实现单台设备带载 88K 超大屏,满足电影虚拟拍摄中高清 LED 显示控制、倍频插帧等技术需求。
此外,FPGA 能够通过硬件实现特定算法,绕过传统 CPU、GPU 的软件堆栈瓶颈,实现超低延时。以颜色空间转换为例,FPGA 处理延时仅为 CPU、GPU 的 1/100。此外,FPGA 固定的电路结构保证确定性延迟,而 CPU、GPU 因系统调度存在延迟抖动。在医疗 8K 内镜视频处理、高频交易等对延迟要求严苛的场景中,FPGA 优势显著。
当前 FPGA 开发门槛降低,厂商提供专业 IP 模块与完整解决方案,高层综合等开发方法也适用于音视频处理。此外,FPGA 生命周期长,满足专业音视频设备长服役需求,实现 " 一次开发终身可用 ",相比依赖算力持续升级的 GPU,在该领域更具应用价值。
厂商布局
各大厂商基于自身技术优势和市场定位,在不同技术路线上展开布局。
在 NPU 阵营,意法半导体、瑞萨、华为昇腾等厂商通过 "MCU+NPU" 的组合策略,全力抢占 IoT 市场份额。这种将微控制单元与神经处理单元相结合的方案,既能发挥 MCU 在控制和管理方面的成熟优势,又借助 NPU 强大的 AI 运算能力,满足 IoT 设备对低功耗、实时性 AI 处理的需求。全志科技推出的 V821 芯片已实现量产,并成功搭载于领为创新 AI 眼镜,为智能穿戴设备的 AI 应用提供了有力支持,展现出 NPU 在终端设备上的广泛应用潜力。
GPU 阵营中,曾被苹果弃用的 Imagination 正凭借 "AI+ 图形 " 的融合架构谋求新突破。其 E 系列 GPU IP 具备强大的并行处理能力,支持 16 个虚拟机实例并行运行,这一特性使其能够完美适配车载座舱多屏交互与 ADAS 监控等复杂场景,为汽车智能化升级提供高效的图形与 AI 处理解决方案。而行业巨头英伟达则依托 Jetson 系列产品,深度渗透机器人视觉领域。Jetson 平台以其高性能、低功耗的特点,成为众多机器人开发者的首选,助力机器人在复杂环境中实现精准的视觉识别与决策。
在 FPGA 阵营,Altera 聚焦数据中心与边缘推理市场,充分发挥 FPGA 可编程、灵活高效的特性,为数据处理和 AI 推理提供定制化解决方案,满足数据中心对高并发、低延迟处理的需求,以及边缘设备在复杂场景下的实时推理要求。Lattice 则凭借低功耗 FPGA 产品,成功打入智能摄像头与传感器市场。在这些对功耗和体积要求严苛的应用场景中,Lattice 的低功耗 FPGA 既能保证设备长时间稳定运行,又能满足实时数据处理和 AI 分析的需求,为智能安防、环境监测等领域的设备智能化升级提供了可靠的技术支撑。
并购潮起
除了凭借自身研发力量拓展技术版图外,各大厂商也纷纷通过并购整合资源、强化优势,以在快速变化的市场中抢占先机。
意法半导体(ST)收购 AI 软件公司 DeepLite,旨在深化自身在 AI 算法优化领域的实力。DeepLite 的核心技术能够将 AI 模型压缩至极致,使复杂的 AI 算法在低功耗设备上高效运行。此次收购完成后,意法半导体可以将 DeepLite 的技术深度融入其 "MCU+NPU" 产品体系,进一步巩固在 IoT 市场的优势地位,为智能家电、可穿戴设备等终端产品提供更具竞争力的 AI 解决方案。
高通宣布收购边缘 AI 开发平台 Edge Impulse,是其完善边缘计算生态的重要举措。Edge Impulse 平台专注于简化边缘设备上的 AI 开发流程,支持开发者快速创建、训练和部署 AI 模型。高通通过此次收购,能够将 Edge Impulse 的开发工具与自身的芯片技术相结合,降低边缘 AI 应用的开发门槛,吸引更多开发者基于高通芯片进行创新,加速 AI 技术在智能家居、工业物联网等领域的落地应用。
恩智浦(NXP)收购 AI 芯片初创公司 Kinara,则聚焦于强化其在高性能 AI 推理领域的能力。Kinara 开发的 AI 处理器以高效能和低功耗著称,尤其适用于智能汽车、工业自动化等对实时性要求极高的场景。此次收购后,恩智浦将 Kinara 的技术整合到自身产品线中,能够为汽车制造商和工业客户提供更强大的 AI 处理解决方案,进一步巩固其在汽车半导体和工业控制领域的领先地位。
结尾
在这场由边缘生成式 AI 掀起的技术浪潮中,半导体产业正经历着一场深刻而广泛的变革。从 GPU 的灵活通用,到 NPU 的高效专一,再到 FPGA 的可重构性,不同架构在各自擅长的领域里开疆拓土,也映射出行业对未来计算形态的多元探索。
技术的演进从来不是单一线性的替代过程,而是在不断适应场景、解决问题的过程中寻找最优解。面对碎片化且快速变化的边缘 AI 应用场景,单一架构难以包打天下,真正的竞争力在于如何结合软硬件优势,构建更高效、更灵活、更具延展性的系统方案。
与此同时,厂商们也在通过并购加速补足短板,强化生态布局。这种 " 内生 + 外延 " 并重的发展策略,不仅加快了产品迭代的速度,也为整个产业链注入了更多协同创新的可能性。
站在 2025 年这个被称作 " 边缘生成式 AI 元年 " 的节点回望,我们会发现,这场变革才刚刚开始。