关于ZAKER 合作
钛媒体 12小时前

怎样才能提前 2 年看穿 OpenAI 的发展路径

文 | 李智勇

就在 10 月 6 日的开发者大会上,OpenAI 描绘了一个清晰的未来:

AI 将通过智能体(Agents)无处不在,而 OpenAI 的平台本身,将越来越像一个操作系统。

当他们发布全新的 Apps SDK 时,一个两年前的我的行业演进判断得到了终极印证。

早在 2023 年,我便在《AI 大模型没有商业模式?》等文章中提出,大型语言模型(LLM)的本质是 " 一种新式的云端的操作系统 ",并勾勒了其后续的产业演进脉络,参见:

AI 大模型没有商业模式?

AI 后续发展的七个阶段与造富机会

当时很是被喷了一顿。

这里我想做的就是通过一次复盘,揭示一种能够提前预判走向的分析方法。这种方法的核心,就是我曾在《解玄:共相、道、基类与战略》一文中探讨的:

在 " 实 "(技术现实)与 " 名 "(抽象概念)之间穿梭,进行独立的思考与推演。

解玄:共相、道、基类与战略

先强调下:说到底要回到自己的逻辑,回到技术现实,回到数据(虽然有时候没有),所以还不是算卦。

最新的对未来的判断在下面这本书里面:

最初的判断(2023 年):

在《AI 大模型没有商业模式?》一文中,我明确反对将 LLM 简单类比为云服务或搜索引擎,因为这种类比 " 失之毫厘,谬以千里 "。

● 它不是云服务: 云服务是成本中心,不改变数据价值本身。而 LLM 是 " 数据价值的放大器 ",是利润中心,其放大倍数的差异 " 会导致生死的差异 "。

● 它不是搜索引擎: 搜索的核心是信息集散,而 LLM 的核心是内容生成、逻辑推理乃至决策。将它局限于搜索,是 " 买椟还珠 "。

我当时给出的核心判断是:

LLM 与 Windows 和安卓更像,它是一种新式的、云端的操作系统。

这个 "AI 操作系统 " 将颠覆过去的人机交互范式。在《AI 后续发展的七个阶段与造富机会》中我进一步解释了下:

" 低智能、低信息量的前提下,最合适的吞 - 吐信息的方式一定是分类。菜单、按钮、网页导航等全是分类。整个图形用户界面交互的基础就是分类。高智能、全范围信息量的前提下,最合适的吞吐信息的方式会变成对话。智能体负责分类并折叠了它。"

这意味着,AI 正在成为继 PC、手机之后的第三个 " 通用计算平台 "。

它将以 " 对话 " 和 " 意图 " 驱动,成为所有应用的统一入口,并最终像折叠卡片相机一样,将纯粹的数字工具归并为自身的一个功能。

两年来的事实什么样呢?

OpenAI 的发展路径,尤其是最新的开发者大会,为 " 操作系统 " 这条演进路线提供了个新证据,至少在下面几个方面上:

1. 战略官宣迈向操作系统:这次可以看成是 OpenAI 战略意图的一次彻底摊牌。他们不再满足于提供模型 API 或者做一个简单应用,而是明确将自己定位为一个承载无数 AI 智能体的 " 操作系统 "。这个新操作系统让 chatGPT 这类应用从一个被动的 " 应答者 " 变成了一个可以主动感知、规划、执行任务的 " 行动者 "。

2. 一个完整操作系统的架构浮现: 一个操作系统的生命力在于其应用生态和完整的架构。Apps SDK 后,操作系统的各个组件已经比较清楚(虽然还就像 Win32 的初级阶段)。我们可以类比下:

a. 模型 ( Model ) 如同操作系统的 内核 ( Kernel ) ,负责最底层的智能计算。

b. Apps SDK 扮演了 系统 API 的角色,为上层应用提供调用内核能力的标准接口。

c. GPTs 则像是 应用外壳 ( App Shells ) ,是用户与系统交互的语义化界面。

d. MCP ( 模型控制协议 ) 等类似于 驱动层协议,确保硬件(数据源、外部工具)能被内核识别和调用。

e. ChatGPT 本身,就是这个 AI-OS 的集成体现。这时候要记得奥特曼和苹果的前设计师不停的在勾搭,原因就很清楚了。

f. 而 用户 ( User ) 在这个系统中,则史无前例地扮演了多进程任务调度者 的角色,通过自然语言同时启动和管理多个复杂的任务流(Agents)。不是一个应用干一个事,而是一个应用干所有事。这明显是应用级别的 OS。

这个完整的架构标志着生态构建马上就进入深水区了,一个庞大的原生智能体生态呼之欲出。

最终当然不一定是 OpenAI 胜出,Google 这些玩家怎么可能开心,后面各种常见的竞争套路都会出来的。

3. 操作系统即下代通用计算平台 如果说之前的 ChatGPT 还只是一个超级 App,那么以 Apps SDK 为基础构建的未来,就是一个真正的 " 通用计算平台 "。开发者构建的 Agents 可以操作浏览器、调用其他软件 API、管理文件,真正成为所有软件的上一层——那个总调度的中枢。这正是 " 通用计算平台 " 的本质含义。

这种判断的根源何在?

在《AI 后续发展的七个阶段与造富机会》中我曾画图对比:

● 旧模式: CPU 提供算力,程序员提供智能。

● 新模式: GPU 提供算力,大模型提供智能。

当 " 智能 " 的供给方发生根本性变化后,上层的应用形态、交互方式必然会被重塑。抓住 " 智能供给 " 这个牛鼻子,就能推导出交互方式必然从 " 分类 " 走向 " 对话 ",应用架构必然从 " 孤岛 " 走向 " 被操作系统统一调度 "。

在《AI 大模型没有商业模式?》中,我给出了一个在当时看来颇为悲观的判断:AI 行业,尤其是希望构建平台或深入行业的公司,在 3-5 年内难有商业模式,甚至会 " 加大亏损 "。

原因在于:

1. 商业要素未变: 客户议价能力、成本结构、竞争格局等核心商业要素并未因技术突破而改善。相反,算力、数据、人才成本和模型升级迭代的压力还在剧增。

2. 增长模式改变: AI 平台的构建不是互联网式的 " 大水漫灌 ",而是 " 持续打深井 "。它需要在一个领域做深做透,形成系统性产品(我称之为 " 把 IBM 未完成的沃森事业干好 "),这与追求 " 快 " 的互联网打法背道而驰。

3. 垂直生态的必然性: 我断言,市场不会只有一个通用大模型。因为 "OpenAI 的大模型再厉害也解决不了便利蜂的供货补货问题 "。因此," 每个垂直的领域注定会有一个自己的大模型,而每一个大模型都是一套系统和生态。" 我将其比喻为一个个 " 章鱼 ",模型是头,终端和数据源是触手。

两年来的事实也是基本呼应。

1. 亏损成为常态: 现实情况比预想的更为严峻。除了少数头部玩家,全球绝大多数 AI 创业公司仍在巨额亏损中挣扎,寻找着产品市场契合点(PMF)。" 百模大战 " 的价格战,更是将成本压力推向了极致。

2. 从 " 模型 " 到 " 解决方案 ": 市场风向已然转变。单纯夸耀模型参数已无意义,投资人和客户都在问:" 你的 AI 能为我解决什么具体问题?" 行业共识正在向 " 系统性产品 " 和 " 垂直解决方案 " 聚集。

3. 垂直模型的兴起: 法律、金融、医疗、教育等领域的专业模型和应用层出不穷。企业也逐渐意识到,通用模型只能解决 70% 的问题,剩下 30% 的核心场景,必须依靠与自身数据和工作流深度结合的垂直模型来完成。这正印证了 " 章鱼生态 " 的判断。

在行业早期,信息往往是不充分的,下面就说说这时候的判断方法。但在展开之前还是想强调下,有数先要穷尽数的获取和判断,没有再用下面的方法。

那么,如何才能建立起前瞻性的判断力?

算命肯定不灵,还是需要一套思维框架,其核心在于 " 名 " 与 " 实 " 的相互观照与穿梭。

● " 实 ": 指的是事物的本来面貌,是技术最本质的现实。对应到 LLM,就是它基于 Transformer 架构、是一个 " 预测下一个词 " 的概率模型、它有统计推理能力但会产生幻觉、它极度依赖算力和数据。但它具有通用性,所以和过去模式是并行的。

● " 名 ": 指的是我们用来描述和理解现实的抽象概念、范畴或 " 基类 "。比如 " 工具 "、" 平台 "、" 搜索引擎 "、" 操作系统 "。

许多分析之所以会产生偏差,要么是沉溺于 " 实 " 的细节而缺乏洞见,要么是追逐于 " 名 " 的空谈而脱离根基。真正有效的战略思考,是一场在 " 名 " 与 " 实 " 之间的穿梭:

第一步:始于 " 实 " ——回归技术本源。 首先要做的,是剥去所有媒体和资本赋予的光环,直面 LLM 的技术内核。这里很关键,必须回到技术的根本特征,否则就全是想象和想法。AI 的根本特征是什么呢?它改变计算模式,过去靠程序员堆积 if...else,现在则是任意输入都给你输出结果any...then,并且这种改变具有通用性。(前面都写过的,感兴趣大家自己找就行)

然后就需要思考:一个超级强大的通用决策器,到底能用来做什么?

第二步:跃迁至 " 名 " ——寻找最恰当的抽象。 它最强大的能力是通用性,那它就能成为人与所有机器之间的通用接口。这时候就需要对应到一个概念,这里显然是操作系统,操作系统在过去完成通用计算的任务。它显然不是 " 工具箱里的一个工具 ",也不是简单的 " 信息检索器 " 等单一功能的产品。它通用,所以能调度万物、屏蔽底层复杂性、建立应用生态——这不就是操作系统么!

第三步:在 " 名 " 的世界里推演。 一旦确定了 " 操作系统 " 这个 " 名 "(基类),我就可以调动所有关于操作系统的历史知识和商业规律进行推演。

操作系统的竞争史告诉我们:

● 胜利者最终靠的是生态,而非单一技术领先。

● 它需要漫长的投入和开发者培育周期。

● 它会产生巨大的网络效应和锁定效应。 由此,我自然能推导出关于商业模式、竞争壁垒和产业发展阶段的判断。

现在借助 AI 可以把过去事实的部分简化很多。

第四步:以 " 名 " 驭 " 实 " ——回归现实进行验证。 最后,将这些在 " 名 " 的世界里推演出的结论,映射回 " 实 " 的世界,去观察现实世界的发展是否与之吻合。OpenAI 的每一步,尤其是 10 月 6 日开发者大会的蓝图,都在验证着 " 操作系统 " 这条路径。从这个角度看,它后面要干什么也是可推测的,和微软的关系、Google 的关系等等都是可推测的。

这个过程,正如《解玄》中所说,是 " 从特殊到一般,一般到一般,从一般再到特殊 " 的循环。

它要求思考者既要有工程师般的求实精神,又要有哲学家般的抽象能力。

所有能够经受住时间检验的前瞻性思考,其共同点并非是预测未来,而是在没谱的各种要素里面,找到实的点。分析的锚点需要定在技术的本源之上,并勇敢地进行抽象和推演。

这背后最原点上的支撑其实保持一份独立的判断力,要有自己的体系。自己体系不灵就看啥都有道理。

吴国盛老先生写过这样一段话:

亚里士多德在《形而上学》第一卷开篇谈到三类知识,他认为最基本的知识是经验知识,动物都有经验,但是经验不可传递,所以是知其然不知其所以然的知识。亚里士多德认为比经验更高的知识叫技艺或者技术,这一类知识就有点类似于中国人心目中的理论知识,比经验知识更加普遍化,它能够沟通、能够学习。

但是,亚里士多德说这两类知识都还不是真正的科学,他提出第三类叫科学的知识。这类知识什么意思?首先是超越功利。经验也好、技艺也好,统统都是有实际目的、有实际用途的,只有一类知识是没有功利目的、完全为着自身的目的而存在的,这就是科学。我们中国人的知识谱系里有经验知识、理论知识,在我们看来,一切知识首先来源于经验,然后对经验进行归纳、总结、提升、一般化,构造出理论,理论再反过来为实践服务,这是中国人一般的看法。

但是在我们的知识谱系里始终缺乏这第三个类别,就是科学。这是一种什么样类别的知识呢?亚里士多德说,被我们称为科学的这类知识,必须首先是为了自身的目的存在的,不是为了任何别的目的存在。所以希腊科学的第一个特点叫做 " 为自己的学术 ",是为自己而存在的。

可以简化下:

这意味着啥呢?意味这如果把上述方法弄到极致,你很可能看到些完全没啥用也不该看的东西!

相关阅读

最新评论

没有更多评论了