关于ZAKER Skills 合作
全天候科技 6分钟前

OpenAI 和 Anthropic 都要“自研芯片”,除了成本,还有其他原因?

AI 大模型公司的芯片自研竞赛正在加速。对 OpenAI 和 Anthropic 而言,自研芯片不只是为了压低算力成本,更是为了掌握算力供应,优化模型架构,并在下一轮 AI 基础设施竞争中获得更强的主动权。

据 The Information 周四报道,Anthropic 正与三星洽谈定制人工智能芯片事宜,并已启动自研人工智能芯片的早期开发工作。若该定制服务器芯片最终进入量产,这将成为 Claude 背后公司推进硬件自主化的重要一步。

这一动作被视为 Anthropic 追随 OpenAI 的信号。OpenAI 已更早推进定制 AI 芯片项目,并与芯片设计和制造伙伴合作,试图为 ChatGPT 等产品建设更独立,效率更高的计算基础设施。两家公司共同指向同一趋势,大模型公司正从单纯算法竞争,转向软硬件一体化竞争。

市场影响首先落在三条线上:英伟达等外部 GPU 供应商的议价环境,三星等代工厂在 AI 芯片订单中的机会,以及 AI 初创公司未来融资和上市节奏。据巴伦财经报道,德银分析师近期建议 OpenAI 和 Anthropic 不应过久推迟 IPO,原因之一正是自研芯片和算力基础设施需要巨额长期资本。

自研芯片首先是算力控制权问题

目前,训练和运行大模型需要大量高性能计算资源。AI 计算市场高度依赖英伟达 GPU 架构,供需紧张使模型训练和推理成本维持高位。对 OpenAI 和 Anthropic 这样的模型公司而言,芯片不再只是采购项目,而是核心生产资料。

Anthropic 的 Claude 模型需求在 2026 年显著增长。TradingKey 报道称,Anthropic 高管此前披露,公司年化收入已超过 300 亿美元,而 2025 年底约为 90 亿美元。业务扩张推动算力需求快速上升,也放大了外部芯片供应不确定性对公司运营的影响。

Anthropic 目前仍依赖多种第三方芯片方案,包括 Alphabet 旗下 Google 设计的 TPU,以及 Amazon 自研芯片。报道称,Anthropic 还与 Google 和 Broadcom 达成长期 TPU 供应协议,该协议与其此前承诺的 500 亿美元美国计算基础设施投资计划相关。

这意味着,自研芯片并不等同于完全摆脱外部供应商。更现实的目标是掌握核心设计能力,形成技术备选项,并提升未来商业谈判中的筹码。

成本只是入口,软硬件协同才是关键

自研芯片最直接的理由是降低成本。通过定制 ASIC,AI 公司可以围绕自身模型架构优化计算流程,减少通用芯片中不必要的模块,从而提高能效。若 Anthropic 芯片成功流片并部署,报道称其可能显著降低 API 调用成本,并影响企业 AI 应用市场的定价结构。

但成本并不是唯一变量。SemiAnalysis 创始人 Dylan Patel 在访谈中强调,AI 效率提升的最大空间并不只来自更快芯片,而来自模型,内核和硅片之间的协同设计。他认为,单层优化可能带来两倍提升,但跨层协同可能带来远大于简单相乘的效果。

这解释了为什么 OpenAI 和 Anthropic 都在走向更深的硬件参与。模型架构并非天然适配所有芯片。Dylan Patel 称,OpenAI 模型更偏稀疏,Anthropic 模型相对更稠密,两者在矩阵乘法单元尺寸、注意力机制结构、专家层形状等方面存在显著差异,这使得两家公司在硬件选择上天然倾向于不同方向。" 实际上,按照 OpenAI 模型的发展方向,使用 TPU 对他们而言可能是糟糕的决策;而按照 Anthropic 和谷歌模型的发展方向,用 GPU 训练对他们而言同样可能是糟糕的决策。" 他说。

换言之,自研芯片不只是把英伟达 GPU 替换成自己的芯片。真正目标是让模型从设计之初就能贴合底层硬件,从而改善推理速度,能耗,吞吐量和单位经济性。

对英伟达不是立刻替代,而是长期制衡

自研 AI 芯片从研发设计,流片验证,到最终量产部署,通常需要 18 至 24 个月。即便 Anthropic 与三星顺利达成合作,其自研芯片也很难在短期内实质性替代现有算力供应。

OpenAI 则推进更早。TradingKey 报道称,OpenAI 选择与 Broadcom 和 TSMC 合作,计划在 2026 年下半年部署首款推理芯片。相比 Anthropic,OpenAI 在定制芯片路径上更主动,也更接近落地阶段。

大模型公司自研芯片的方向,确实指向降低对英伟达等供应商的依赖。但这并不意味着 Nvidia 的地位会被迅速削弱。Dylan Patel 在访谈中指出,Nvidia GPU 仍具有通用性优势,许多模型和开源生态本身就是围绕 GPU 优化的。他还提到,所谓 CUDA 护城河并不只是 CUDA 本身,而是大量下游模型和软件生态已经为英伟达硬件形态做了适配。如果模型的专家结构,隐藏维度和通信模式都更适合 GPU,那么即便其他芯片具备优势,迁移也未必简单。

因此,自研芯片更像是建立第二条路线。OpenAI 和 Anthropic 可能会继续使用 GPU,TPU,Trainium 等多种算力资源,同时把自研 ASIC 用于更明确,更稳定,更高频的工作负载,尤其是推理场景。

全行业 " 算力自主权 " 竞赛全面开启

OpenAI 和 Anthropic 自研芯片的共同逻辑,可以概括为三点:降低长期算力成本,减少外部供应依赖,以及通过软硬件协同提升模型效率。

其中,第三点可能最关键。随着模型公司规模扩大,通用算力无法完全满足差异化架构需求。自研芯片让公司能够把模型设计,系统软件和底层硅片放在同一个优化框架内。

但方向已经清楚:大模型竞争正在从 " 谁的模型更强 ",延伸到 " 谁能更好地控制算力,资金和硬件栈 "。这也是 OpenAI 和 Anthropic 都走向自研芯片的真正原因。

Anthropic 的探索并非孤例。从谷歌深耕十余年的 TPU 系列,到亚马逊专注训练场景的 Trainium 系列,再到 Meta 面向推理场景的 MTIA 系列,以及微软持续推进的 Maia 系列,头部科技公司均已在自研芯片赛道上深度布局。

对于三星而言,若能拿下 Anthropic 的芯片代工订单,将为其晶圆代工业务在 AI 领域的影响力带来重要提振。三星目前正与台积电等厂商激烈争夺先进制程客户,引入 Anthropic 这样具有高成长潜力的 AI 客户,有助于扩大其在 AI 半导体领域的版图。

全天候科技

全天候科技

提供专业快速完整的科技商业资讯

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容