"AI 正在重新定义计算的每一个层次。"
这是 AMD AI 开发者大会今天首次落地上海时,AMD 董事会主席、首席执行官苏姿丰针对 AI 行业给出的最新判断。

参加完这一天的活动后可以感受到,从苏姿丰的判断,到整场大会的选题和阵容,都折射出 AI 行业正在加速转变。
竞争的焦点,正在从模型能力转向系统工程与全栈优化能力。

开发者真正需要的,是一套可以落地、可以优化、可以持续演进的工程体系。
这个判断在中国尤其成立。
DeepSeek、Qwen...... 过去两年全球最活跃的一批 AI 工程项目,从未缺少过中国的影子。
中国开发者从来都不只是 AI 应用的消费者,更是基础设施的建设者。
AMD 今天带来的,正是围绕这一趋势的系统性回应。
AI 开发者需要新的工程体系
AI 落地的成本问题,正在成为整个行业绕不开的核心议题。
图灵奖得主、Google 杰出工程师 David Patterson 在 2026 年初发出警告,他表示,AI 大规模落地,正面临一场成本危机。
这场危机乍看有一个颇具反差的面貌,Token 一降再降,但同期的企业 AI 预算却不降反增。

OpenClaw、Hermes 等 Agent 框架在几个月内成为开发者社区最热的基础设施,意味着项目从单次问答切换到 Agent 工作流。
新的工作流下,我们完成一项任务需要多轮规划、多次工具调用、反复验证,每一步都在产生算力消耗。
单次成本降低的情况下,总体成本从账单上的单行数字,变成了系统层面更难看清的累积。
系统层次的问题,自然需要系统性的解决方案,这标志着 AI 竞争正在进入一个新的阶段。
在这个阶段里,能不能在规模化之下把整套体系跑得稳、跑得省、跑得持续,才是真正的考验。
这种考验可以拆解成三个层次。
首先是成本层面,使用规模越大,Token 消耗的累积效应越明显。
一个团队跑十个并发 Agent 和跑一千个,差异不只是消耗的 Token 量,整个系统的调度、容错、资源分配都要重新设计,成本结构随之从线性变成指数级。
一个对话框里问一个问题,消耗的是单次调用;但 Agent 工作流要完成一项任务,背后是多轮规划、多次工具调用、反复验证的完整链路,每一步都在产生算力消耗。
使用规模越大,这种累积效应越明显,成本结构随之从线性变成指数级。
其次,在复杂度层面,工程难度的跃升源于 AI 应用形态的根本变化。
过去的 Chat 范式下,一个模型对应一种能力,边界清晰;但 Agent 时代要求 AI" 能办事 ",一套系统里往往同时跑着多个模型、多种模态、分布式计算和工具调用,任何一个环节的延迟或失败都会影响整个链路。
工程师面对的,是如何维护一套持续演进、随时可能扩展的生产系统。
最后是部署层面,场景碎片化正在成为新的工程负担。
云端推理满足不了所有场景,有些场景要求数据不出本地,有些场景对延迟极度敏感,有些场景根本没有稳定网络。
这些需求把开发者推向了边缘设备和端侧部署,但每换一个硬件平台,工具链、优化策略、调试环境往往都要重来一遍,碎片化带来的隐性成本在悄悄累积。
三层压力叠加,指向同一个结论,开发者真正需要的,是一套可落地、可优化、可持续演进的工程体系。
苏姿丰:中国正在领跑开放生态
这次 AI 开发者大会上,AMD 董事会主席、首席执行官苏姿丰对这套需求给出了 AMD 的判断:
Agent 时代,每个人可以拥有 5 个、10 个甚至 100 个 Agent,算力消耗的结构随之发生根本性变化,单纯堆 GPU 已经不够,GPU 加 CPU 的完整端到端算力组合才能真正满足需求。
AMD 的解决策略,是提供覆盖云端到端侧的全栈算力,以 ROCm 开源软件平台为核心,让开发者在每一个部署场景里都能找到合适的工具。
这些判断,有更长的来路。
AMD 在全球战略层面,面对 AI 工程化大趋势,有着一套一以贯之的战略。
今年年初的 CES 2026 上,苏姿丰已经给出了方向:开放生态是 AI 下一阶段的基础设施。

基础设施意味着它不属于任何一家公司,它是整个行业共同依赖、共同建设、共同受益的底层。
AMD 选择把这个词用在开放生态上,就是在表明一种立场:AI 的未来,不应该被锁定在某一套封闭的系统里。
这个立场,也在推动着 AMD 对自身定位的重塑。

软硬件协同与开放生态是实现这一目标的路径。
软件层面的开放让开发者不被硬件代际绑定,硬件层面的持续迭代为软件生态提供更强的底层支撑。
两者互相加持,形成一个庞大开发者群体愿意长期留在其中的体系。
具体到中国市场,AMD 深耕大中华区超过 30 年,上海研发中心是 AMD 全球最大的研发中心之一。
在苏姿丰看来,中国不只是 AMD 的重要市场,更是 AMD 全球路线图的重要组成部分,从芯片到 AI 软件,再到平台工程,AMD 在中国的投入覆盖了完整的技术栈。
同时,在开源生态的判断上,苏姿丰直接点出,中国正在领跑开放生态,这种开放性是推动整个 AI 生态尽可能快速演进的核心力量,也与 AMD 的战略方向高度契合。
这次在上海举办大会,正是这套战略在中国市场落地和延续的彰显。
在中国,这套战略落到实处意味着这几件具体的事:
持续投入本地开发者社区建设,让中国开发者在日常工程实践中能真正用起来、用得好;
与本地开源生态协同,免去开发者自己去做适配工作的繁冗;
最终把 AI 开发与部署的门槛降下来,让更多团队有能力把想法变成跑在生产环境里的系统。
AI 开始进入系统化工程实践
AI 工程化的竞争,正在变成整个开发者社区需要共同面对的基础建设问题。
这次 AMD 的 AI 开发者大会,设置了实战工作坊和技术专题演讲环节,其中的议题分布,就是当下 AI 工程实践的一个截面。

单轮问答的时代,推理成本可以用单次调用的价格来衡量;Agent 工作流完成一个任务要经过多轮规划、工具调用和验证,消耗结构完全变了。
如何在新范式下压低 Token 成本,如何让推理引擎在高并发场景下维持吞吐效率,如何让推理优化本身也能自动化运转,是整个行业正在啃的硬骨头,也是这次推理专题的核心命题。

RLHF 从研究论文变成各团队的标配流程,怎么在单卡上高效跑通端到端的对齐训练就成了实际问题;
MoE 架构开始大规模商用,超大规模训练的稳定性和效率,变成了每天都要面对的工程任务。
端侧方向,则是变化最明显的一块。
完全离线的 AI 桌面机器人、本地大模型驱动的个人 Agent、在本地硬件上跑通完整开发流程的 vibe coding...... 这些场景已经可以在具体的 AMD 端侧硬件上实现。
端侧 AI 不再是云端的降级替代,它在隐私保护、低延迟、离线可用等场景下有自己的工程逻辑,需要一套从模型量化到本地推理加速的完整支撑。

AI Kernel 开发、编译器优化、GPU 内核 AI 智能体、PyTorch 分布式训练框架在 AMD GPU 上的适配 ...... 关注的都是决定整个生态能走多远的基础设施层。
AMD 正在通过实战工作坊、开源工具链与真实工程场景,强化与开发者社区的长期连接,推动 AI 开发从模型使用走向系统构建。
从这些议题可以看出,AMD 想建立的是让开发者从听懂到做出来、再到持续演进的完整飞轮。
值得一提的是,AMD AI 开发者计划 - 中国也在今天正式上线。
这是 AMD 面向 AI 开发者打造的会员生态项目,通过技术资源、开发课程、社区交流和开发者活动等多元支持,帮助开发者更高效地开展 AI 应用与大模型相关开发。
加入计划的开发者,可以与更广泛的中国开发者社区建立连接,参与由 AMD AI 专家及生态伙伴支持的技术交流与工作坊。
本次会后,AMD 将通过这个计划,持续提供技术内容更新、社区互动、后续开发者活动等资源。
持续加码中国开发者生态建设
开发者生态的建设,是一场长期投入,需要工具链的持续完善、社区的持续运营、本地化适配的持续跟进,以及开发者在一次次真实工程实践中积累起来的信任。
这种信任一旦形成,切换成本极高,因为整个团队的工程惯性、积累的优化经验、调试过的工作流,都已经深度嵌入进来。
显然,这种信任已经被 AMD 握在了手中。
今天的上海,中国 AI 工程生态几乎所有关键方向的一线建设者,都被 AMD 召集在了同一个活动现场。

从 DeepSeek、Qwen 等中国主流开源模型的第一时间适配,到本地开发者社区的持续建设,AMD 在做的事有一条清晰的逻辑:
让中国开发者在日常工程实践中真正用起来、用得好。
这个逻辑背后,是 AMD 对中国 AI 市场的一个基本判断:中国不只是 AI 应用的消费市场,更是 AI 基础设施的重要建设者。
中国开源社区在训练框架、推理引擎、模型量化等方向上的贡献,正在被全球开发者社区广泛采用。
AMD 选择在这个时间节点深度投入中国开发者生态,既是对这一现实的认可,也是对未来的一次押注,他们正在通过开源协同、工具链建设与本地开发者连接,持续加码在中国 AI 开发者生态中的长期投入。
AI 时代最深的护城河,是开发者选择在你的平台上构建,并且不想离开。
AMD 在做的事,正是让这件事在中国市场一点一点成为现实。
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
点亮星标
科技前沿进展每日见