5 月 20 日,阿里云在峰会上宣布完成 " 芯片 - 云 - 模型 - 推理 " 全栈 Agent 化升级,同步推出全新 AI 产品官网 " 千问云 "、搭载自研 AI 芯片真武 M890 的超节点服务器,以及最新旗舰模型 Qwen3.7-Max。
这是国内云厂商首次围绕 Agent 进行全栈产品发布。阿里云资深副总裁刘伟光表示, Agent 突破临界点之后可以 24 小时不间断工作,对 AI 和云的需求无穷无尽。阿里云正在进行全栈技术革新,从底层芯片、Agentic Cloud、模型到推理平台全面升级,建设中国最大的 AI 工厂。

这场变化有一个最直观的注脚:阿里云新推出的 " 千问云 " 官网,突出的不是产品列表,也不是控制台入口,只有一行 Agent 可读的代码指令,意思是 " 请安装千问云 skills"。云的用户正在从人变成 Agent,而阿里云决定让整套技术体系为此全面重构。
芯片:基于新一代真武芯片的超节点服务器
在芯片层,阿里云亮出了一张目前国内云厂商中独一份的牌——覆盖算力、网络、存储的完整自研数据中心芯片矩阵。
峰会上,阿里发布基于新一代 AI 芯片真武 M890 的磐久 AL128 超节点服务器,搭载自研互联芯片 ICN Switch 1.0,可让 128 张 AI 芯片组成一台计算机,P2P 时延低于 150ns,主打解决 Agent 场景下的海量并发推理和大模型训练需求,目前已上线阿里云百炼,支持 Qwen、DeepSeek、Kimi 等主流模型。

平头哥新一代训推一体 AI 芯片真武 M890 首次亮相,规格相当硬核:144GB 显存,片间互联带宽 800GB/s,性能是上一代真武 810E 的 3 倍。
平头哥同时首次公布了真武系列芯片的路线规划:未来两年将陆续推出算力更强的真武 V900、真武 J900 两代芯片。目前真武系列 AI 芯片累计出货 56 万片,已服务中国电信、中国一汽、浦发银行等 20 多个行业的 400 多家客户。

平头哥半导体副总裁高慧表示,Agentic 时代,一个 Agent 在执行任务时可能在毫秒间连续发起数十次模型调用,同时需要 CPU、GPU、网络和存储等核心部件紧密协同。平头哥构建全栈自研芯片矩阵,核心就是希望实现算力、网力、存力的系统级协同,让每一个 Agent 都能流畅、稳定运行。
全面迈入 Agentic Cloud
阿里云还在做一件更底层的事:把云产品本身变成 Agent 能用的东西。传统云产品的设计逻辑是面向人的:打开控制台,看到一堆菜单、配置项、仪表盘,这些视觉化的信息对人很友好,但对 Agent 毫无意义。
为此,阿里云对云产品进行了 Skill 化、MCP 化和 CLI 化改造,让每一个云产品都变成 Agent 可以 " 像调函数一样调用 " 的标准化能力模块。
阿里云首席技术官李飞飞认为,传统云产品的交互逻辑是为人设计的——用户看着控制台点击按钮,或者通过 API 编写代码调用。但 Agent 工作负载是 " 无规律弹性、短生命周期、瞬时起量即走 ",与传统云计算的稳态负载截然不同。

对此,阿里云为 Agent 构建了完整的运行环境支撑,提供轻量高效的沙箱执行环境、多 Agent 协同能力、跨任务的记忆能力、顺畅的数据流转通路,以及全域智能运维能力。
Qwen3.7-Max 国产第一,胜任 35 小时长程任务
Qwen3.7-Max 是阿里巴巴最新发布的旗舰大模型。在三方机构 Arena 全球大模型盲测总榜中,Qwen3.7-Max 超过 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与 GPT、Claude、Gemini 最强模型接近,位列国产模型第一。


没有人类干预,没有中间指导,35 小时,从零到生产级。这个案例的示范意义在于:它展示的不是模型 " 回答问题 " 的能力,而是模型 " 自主完成复杂工程任务 " 的能力——这恰恰是 Agent 场景最核心的需求。
阿里巴巴通义大模型事业部负责人周靖人表示:" 大模型正在经历一次核心范式转移——从对齐人类偏好,到对齐任务目标。过去我们追求的是模型 ' 说得好 ',现在要求模型 ' 做得到 '。Qwen3.7-Max 的设计初衷,就是让模型真正成为 Agent 的智能内核,具备自主规划、持续迭代、跨工具协作的能力。"

值得注意的是,近 3 个月内千问旗舰模型已经连续迭代了 3.5、3.6、3.7 三个版本,保持着极高的发布节奏。阿里巴巴显然在刻意加速模型进化,以匹配 Agent 时代对模型能力的指数级增长需求。
百炼推理平台实现极致弹性
如果说芯片是地基、模型是引擎,那百炼推理平台就是 Agent 真正跑起来的 " 生产车间 "。
阿里云在百炼平台上构建了大规模 GPU 资源集群,并通过一套完整的技术栈来应对 Agent 场景的特殊挑战:
● 并池调度:将 GPU 资源统一调度,提升整体利用率;
● 上下文缓存:消除 Agent 在多轮对话和长链路任务中的重复计算开销;
● 吞吐弹性调度:应对 Agent 并发请求的波峰波谷,确保在流量激增时不崩溃、在低谷期不浪费;
● Agentic RL:基于 Agent 实际执行反馈的强化学习机制,让模型在真实场景中越用越好,持续迭代。
此外,百炼内建了安全治理能力。这一点容易被忽略,但在 Agent 自主运行的语境下极其关键——一个 24 小时不间断执行任务的 Agent,如果没有边界约束,后果不可控。百炼的安全机制确保 Agent 始终在预设的权限范围内行动。
在生态策略上,百炼保持开放接入。除了阿里自研的千问模型矩阵,平台还将接入智谱 GLM-5.1、MiniMax M2.7、月之暗面 Kimi K2.6、可灵、Vidu Q3 等第三方模型。
千问云:Agentic 时代的新入口
千问云(www.qianwenai.com)是阿里云成立 17 年来,首次在阿里云官网之外推出的全新产品官网。
打开页面,突出的不是产品列表,也不是控制台,没有任何传统意义上的导航结构。首页只有一行字:安装 Skills npx skills add QianWen-AI/qianwen-ai

这是一条 Agent 可读的 prompt 指令。阿里云将所有模型服务的核心能力封装为标准化的 Skills 和 CLI 工具,智能体可以直接解析这条指令," 学会 " 网站的全部能力,并根据需求自主调用。
过去十年,云的交互逻辑是 " 人登录控制台→选产品→配参数→调 API"。这套流程对人类来说已经足够顺畅,但对 Agent 来说完全不可用。Agent 不看网页,不点按钮,它需要的是结构化的能力描述、明确的调用协议和可预期的反馈机制。阿里云同步推出了 Skills 门户,将常用云功能统一封装为可被 Agent 直接调用的标准化模块,用户仅需一句自然语言指令,Agent 即可完成从资源识别到应用部署的全流程。
上一次中国头部科技公司以如此决绝的方式重构产品入口,可能要追溯到移动互联网早期,当所有人把 PC 官网的流量让位给 App 的那个阶段。只不过这一次更彻底:App 至少还需要人去打开,而 Agent 只需要 " 读 " 一条指令。
阿里云用一行代码替代了整个官网,这是对未来用户形态的一次押注——当云的主要消费者不再是人,而是 Agent,所有围绕人类设计的界面、流程和交互逻辑,都将被重写。
雷峰网