9 月 24 日,在杭州召开的云栖大会上,阿里巴巴集团 CEO、阿里云智能集团董事长兼 CEO 吴泳铭发表主旨演讲,他认为实现通用人工智能 AGI 已是确定性事件,但这只是起点,终极目标是发展出能自我迭代、全面超越人类的超级人工智能 ASI。
第一阶段:" 智能涌现 ",AI 通过学习海量人类知识具备泛化智能。
第二阶段:" 自主行动 ",AI 掌握工具使用和编程能力以 " 辅助人 ",这是行业当前所处的阶段。
第三阶段:" 自我迭代 ",AI 通过连接物理世界并实现自学习,最终实现 " 超越人 "。
为实现这一目标,吴泳铭明确了阿里云的战略路径。阿里云作为 " 全栈人工智能服务商 ",将通过两大核心路径实施 AI 战略:第一,通义千问坚定开源开放路线,致力于打造 "AI 时代的 Android";其二,构建作为 " 下一代计算机 " 的超级 AI 云,为全球提供智能算力网络。
为支撑这一宏大愿景,吴泳铭表示,阿里巴巴正在积极推进三年 3800 亿的 AI 基础设施建设计划,并将会持续追加更大的投入。根据远期规划,为了迎接 ASI 时代的到来,对比 2022 年这个 GenAI 的元年,2032 年阿里云全球数据中心的能耗规模将提升 10 倍。
以下为演讲全文——
开始演讲之前,我想特别感谢一下支持整个中国乃至全球科技行业的开发者朋友。今天是云栖大会的 10 周年,云栖大会起源于阿里云的开发者大会,是广大开发者推动了中国乃至全球的云计算、AI 和科技行业的发展。所以,在演讲之前,我想特别向开发者们致以最高的谢意。
当前的世界,一场由人工智能驱动的智能化革命刚刚开始。过去几百年,工业革命通过机械化放大了人类的体能,信息革命通过数字化放大了人类的信息处理能力。而这一次,智能化革命将远超我们的想象。通用人工智能 AGI 不仅会放大人类智力,还将解放人类的潜能,为超级人工智能 ASI 的到来铺平道路。
最近的三年,我们已经清晰地感受到它的速度。几年时间,AI 的智力从一个高中生迅速提升到博士生的水平,还能拿到国际 IMO 的金牌。AI Chatbot 是人类有史以来用户渗透率最快的功能。AI 的行业渗透速度超过历史上所有技术。Tokens 的消耗速度两三个月就翻一番。最近一年,全球 AI 行业的投资总额已经超过 4000 亿美元,未来 5 年全球 AI 的累计投入将超过 4 万亿美元,这是历史上最大的算力和研发投入,必然将会加速催生更强大的模型,加速 AI 应用的渗透。
实现 AGI ——一个具备人类通用认知能力的智能系统,现在看来已成为确定性事件。然而,AGI 并非 AI 发展的终点,而是全新的起点。AI 不会止步于 AGI,它将迈向超越人类智能、能够自我迭代进化的超级人工智能(ASI)。
AGI 的目标是将人类从 80% 的日常工作中解放出来,让我们专注于创造与探索。而 ASI 作为全面超越人类智能的系统,将可能创造出一批 " 超级科学家 " 和 " 全栈超级工程师 "。ASI 将以难以想象的速度,解决现在未被解决的科学和工程问题,比如攻克医学难题、发明新材料、解决可持续能源和气候问题,甚至星际旅行等等。ASI 将以指数级的速度推动科技的飞跃,引领我们进入一个前所未有的智能时代。
第一阶段是 " 智能涌现 ",特征是 " 学习人 "。过去几十年的互联网发展,为智能涌现提供了基础。互联网将人类历史上几乎所有的知识都数字化了。这些语言文字承载的信息,代表了人类知识的全集。基于此,大模型首先通过理解全世界的知识集合,具备了泛化的智能能力,涌现出通用对话能力,可以理解人类的意图,解答人类的问题,并逐渐发展出思考多步问题的推理能力。现在,我们看到 AI 已经逼近人类各学科测试的顶级水平,比如国际数学奥赛的金牌水平。AI 逐渐具备了进入真实世界、解决真实问题、创造真实价值的可能性。这是过去几年的主线。
第二个阶段是 " 自主行动 ",特征是 " 辅助人 "。这个阶段,AI 不再局限于语言交流,而是具备了在真实世界中行动的能力。AI 可以在人类的目标设定下,拆解复杂任务,使用和制作工具,自主完成与数字世界和物理世界的交互,对真实世界产生巨大影响。这正是我们当下所处的阶段。
实现这一跨越的关键,首先是大模型具备了 Tool Use 能力,有能力连接所有数字化工具,完成真实世界任务。人类加速进化的起点是开始创造和使用工具,现在大模型也具备了使用工具的能力。通过 Tool Use,AI 可以像人一样调用外部软件、接口和物理设备,执行复杂的真实世界任务。这个阶段,由于 AI 能够辅助人类极大提高生产力,它将快速的渗透到物流、制造、软件、商业、生物医疗、金融、科研等几乎所有行业领域。
其次,大模型 Coding 能力的提升,可以帮助人类解决更复杂的问题,并将更多场景数字化。现在的 Agent 还比较早期,解决的主要是标准化和短周期的任务。要想让 Agent 能解决更复杂、更长周期任务,最关键的是大模型的 Coding 能力。因为 Agent 可以自主 Coding,理论上就能解决无限复杂的问题,像工程师团队一样理解复杂需求并自主完成编码、测试。发展大模型 Coding 能力是通往 AGI 的必经之路。
未来,自然语言就是 AI 时代的源代码,任何人用自然语言就能创造自己的 Agent。你只需要输入母语,告诉 AI 你的需求,AI 就能自己编写逻辑、调用工具、搭建系统,完成数字世界的几乎所有工作,并通过数字化接口来操作所有物理设备。 未来,也许会有超过全球人口数量的 Agent 和机器人与人类一起工作,对真实世界产生巨大影响。在这个过程中,AI 就能连接真实世界的绝大部分场景和数据,为未来的进化创造条件。
随后 AI 将进入第三个阶段—— " 自我迭代 ",特征是 " 超越人 "。这个阶段有两个关键要素:
第一、 AI 连接了真实世界的全量原始数据
目前 AI 的进步最快的领域是内容创作、数学和 Coding 领域。我们看到这三个领域有明显的特征。这些领域的知识 100% 是人类定义和创造的,都在文字里,AI 可以 100% 理解原始数据。但是对于其他领域和更广泛的物理世界,今天的 AI 接触到的更多是人类归纳之后的知识,缺乏广泛的、与物理世界交互的原始数据。这些信息是有局限的。AI 要实现超越人类的突破,就需要直接从物理世界获取更全面、更原始的数据。
举一个简单的例子,比如一家汽车公司的 CEO 要迭代明年的产品,大概率会通过无数次的用户调研或者内部的讨论来决定下一款汽车将要具备什么样的功能,与竞对相比要实现哪些方面的长板,保留什么方面的能力。现在 AI 要去做还是很难的,核心点在于它所获得的数据和信息,全都是调研来的二手数据。如果有一天 AI 有机会,能够连接这款汽车的所有的资料和数据,它创造出来的下一款汽车会远远超过通过无数次头脑风暴所创作出来的。这只是人类世界当中的一个例子,更何况更复杂的物理世界,远远不是通过人类知识归纳就能够让 AI 理解的。
所以 AI 要进入到一个更高的阶段,就需要直接从物理世界获取更全面、更原始的数据,就像在自动驾驶的早期阶段,只靠人类的总结,Rule-based 的方法去实现自动驾驶,无法实现很好的效果。新一代的自动驾驶,大部分采用端到端的训练方法,直接从原始的车载摄像头数据中学习,实现了更高水平的自动驾驶能力。即便我们现在看起来相对简单的自动驾驶问题,仅依靠人类归纳的知识和规则,也无法解决,更何况整个复杂的物理世界。只是让 AI 学习人类归纳的规律,是远远不够的。只有让 AI 与真实世界持续互动,获取更全面、更真实、更实时的数据,才能更好的理解和模拟世界,发现超越人类认知的深层规律,从而创造出比人更强大的智能能力。
第二、Self-learning 自主学习
随着 AI 渗透更多的物理世界场景,理解更多物理世界的数据,AI 模型和 agent 能力也会越来越强,有机会为自己模型的升级迭代搭建训练 infra、优化数据流程和升级模型架构,从而实现 Self learning。这会是 AI 发展的关键时刻。
随着能力的持续提升,未来的模型将通过与真实世界的持续交互,获取新的数据并接收实时反馈,借助强化学习与持续学习机制,自主优化、修正偏差、实现自我迭代与智能升级。每一次交互都是一次微调,每一次反馈都是一次参数优化。当经过无数次场景执行和结果反馈的循环,AI 将自我迭代出超越人类的智能能力,一个早期的超级人工智能(ASI)便会成型。
一旦跨过某个奇点,人类社会就像按下了加速键,科技进步的速度将超越我们的想象,新的生产力爆发将推动人类社会进入崭新的阶段。这条通往超级人工智能的道路,在我们的眼前正在日益清晰。随着 AI 技术的演进和各行各业需求爆发,AI 也将催生 IT 产业的巨大变革。
我们认为大模型代表的技术平台将会替代现在 OS 的地位,成为下一代的操作系统。未来,几乎所有链接真实世界的工具接口都将与大模型进行链接,所有用户需求和行业应用将会通过大模型相关工具执行任务,LLM 将会是承载用户、软件 与 AI 计算资源交互调度的中间层,成为 AI 时代的 OS。来做一些简单的类比:自然语言是 AI 时代的编程语言,Agent 就是新的软件,Context 是新的 Memory,大模型通过 MCP 这样的接口,连接各类 Tools 和 Agent 类似 PC 时代的总线接口,Agent 之间又通过 A2A 这样的协议完成多 Agent 协作类似软件之间的 API 接口。
大模型将会吞噬软件。大模型作为下一代的操作系统,将允许任何人用自然语言,创造无限多的应用。未来几乎所有与计算世界打交道的软件可能都是由大模型产生的 Agent,而不是现在的商业软件。潜在的开发者将从几千万变成数亿规模。以前由于软件开发的成本问题,只有少量高价值场景才会被工程师开发出来变成商业化的软件系统。未来所有终端用户都可以通过大模型这样的工具来满足自己的需求。
模型部署方式也会多样化,它将运行在所有设备上。现在主流的调用模型 API 的方式,来使用模型只是初级阶段,其实看起来非常原始。类似大型主机时代的分时复用阶段,每个人只有一个终端连接上大型主机分时复用。这种方式无法解决数据持久化,缺乏长期记忆,实时性不够,隐私无法解决,可塑性也不够。未来模型将运行在所有计算设备中,并具备可持久记忆,端云联动的运行状态,甚至可以随时更新参数,自我迭代,类似我们今天的 OS 运行在各种环境之中。
正是基于这个判断,我们做了一个战略选择:通义千问选择开放路线,打造 AI 时代的 Android。我们认为在 LLM 时代,开源模型创造的价值和能渗透的场景,会远远大于闭源模型。我们坚定选择开源,就是为了全力支持开发者生态,与全球所有开发者一起探索 AI 应用的无限可能。
大模型是运行于 AI Cloud 之上新的 OS。这个 OS 可以满足任何人的需求。每个人都将拥有几十甚至上百个 Agent,这些 Agent 24 小时不间断地工作和协同,需要海量的计算资源。
数据中心内的计算范式也在发生革命性改变,从 CPU 为核心的传统计算,正在加速转变为以 GPU 为核心的 AI 计算。新的 AI 计算范式需要更稠密的算力、更高效的网络、更大的集群规模。
这一切都需要充足的能源、全栈的技术、数百万计的 GPU 和 CPU,协同网络、芯片、存储、数据库高效运作,并且 24 小时处理全世界各地的需求。这需要超大规模的基础设施和全栈的技术积累,只有超级 AI 云才能够承载这样的海量需求。未来,全世界可能只会有 5-6 个超级云计算平台。
首先,我们有全球领先的大模型——通义千问。通义千问开源了 300 多款模型,覆盖了全模态、全尺寸,是最受全球开发者欢迎的开源模型。截至目前,通义千问全球下载量超 6 亿次,衍生模型超 17 万个,是全球第一的开源模型矩阵,可以说是渗透计算设备最广泛的大模型。
同时,阿里云提供一站式模型服务平台百炼,支持模型定制化以及 Agent 快速开发,同时提供 AgentBay 这样的 Agent 运行环境、灵码 /Qoder 等一系列开发者套件,让开发者可以方便地使用模型能力和创建使用 Agent。
其次,阿里云运营着中国第一、全球领先的 AI 基础设施和云计算网络,是全球少数能做到软硬件垂直整合的超级 AI 云计算平台之一。在硬件和网络层面,阿里云自研的核心存储系统、网络架构、计算芯片,构成了阿里云大型计算集群最坚实的底座。
阿里云正在全力打造一台全新的 AI 超级计算机,它同时拥有最领先的 AI 基础设施和最领先的模型,可以在基础架构设计和模型架构上协同创新,从而确保在阿里云上调用和训练大模型时,能达到最高效率,成为开发者最好用的 AI 云。
AI 行业发展的速度远超我们的预期,行业对 AI 基础设施的需求也远超我们的预期。我们正在积极推进三年 3800 亿的 AI 基础设施建设计划,并将会持续追加更大的投入。从现在我们看到的 AI 行业远期发展以及客户需求角度来看,为了迎接 ASI 时代的到来,对比 2022 年这个 GenAI 的元年,2032 年阿里云全球数据中心的能耗规模将提升 10 倍。这是我们的一个远期规划,我们相信通过这样的饱和式投入,能够推动 AI 行业的发展,迎接 ASI 时代的到来。
超级人工智能到来之后,人类和 AI 会是怎么样的协作关系?
未来的 AI 越来越强,甚至超越人类智能能力的 ASI 诞生,那我们人类和 AI 将如何相处?我们对未来充满乐观,超级人工智能到来之后,人类和 AI 是一个崭新的协同方式。程序员可能已经感受到了,我们可以下一个指令,通过 Coding 这样的工具,让它晚上 12 个小时就能够创造出一个我们需要的系统,从这里我们看到了未来人和 AI 怎么样去共同协同的一种早期的雏形。所以我们觉得,从 Vibe Coding 到 Vibe Working。未来,每个家庭、工厂、公司,都会有众多的 Agent 和机器人 24 小时为我们服务。也许,未来每个人都需要使用 100 张 GPU 芯片为我们工作。
正如电曾经放大了人类物理力量的杠杆,ASI 将指数级放大人类的智力杠杆。过去我们消耗 10 个小时的时间,获得 10 小时的结果。未来,AI 可以让我们 10 小时的产出乘以十倍、百倍的杠杆。回顾历史,每次技术革命解锁更多生产力之后,都会创造出更多的新需求。人会变得比历史上任何时候都强大。
最后,我想强调,一切才刚刚开始。AI 将重构整个基础设施、软件和应用体系,成为真实世界的核心驱动力,掀起新一轮智能化革命。阿里巴巴将持续投入,与合作伙伴和客户一起,让 AI 深入产业、共创未来。祝大家度过一个充实愉快的云栖大会,谢谢大家!