文 | 窄播,作者 | 李威
这是《窄播 Weekly》的第 68 期,本期我们关注的商业动态是:OpenAI 在今年的 DevDay 上更清晰地向我们展示了如何构建一个 AI 时代的超级系统。
上周用 Sora 2 引爆 AI 圈之后,本周 OpenAI 继续贡献了 AI 领域的两个热点话题。一个是在 DevDay 上公布的 Apps in ChatGPT 和 Agent Kit,让大家看到了 OpenAI 准备如何围绕 ChatGPT 的对话式交互,去构建一个 AI 时代的「Windows」系统。另一个则是 OpenAI 在算力采购领域的大手笔投资,有估算认为采购总额已经接近 1 万亿美元。
就像 OpenAI 的 CEO 山姆 · 奥特曼在一档播客节目中所说,ChatGPT 上线之后经历了两个关键的「惊喜」时刻,首先是用户增长和黏性都远超预期,其次则是科技巨头们没有及时跟进,给 ChatGPT 留出了建立竞争优势的空间。
也因此,在过去的两年多时间里,OpenAI 得以稳步推进自己的战略布局。
这个布局的全景就是要构建起三个相互依存的 AI 基础设施:第一,通过大规模投资算力基础设施,掌握足够充裕的算力资源,支撑大模型的进化和应用;第二,通过不断优化,建立性能强悍的大模型家族,在核心技术层面保持领先优势;第三,依托算力和模型基础,推动构建以 ChatGPT 为核心的 AI 应用生态。
相比 OpenAI 在算力层面的投资,我们会更关注 OpenAI 将如何围绕 ChatGPT 构建奥特曼口中的一个「真正强大的 AI 超级系统」。这是普通用户更有直观感知,并且更能够给到当下国内的 AI 产品启发的一个层面。
其中,刚刚推出的 Apps in ChatGPT 尤其值得关注。这个功能将 AI 助理与浏览器进行了更深层次融合,探索了传统 App 与 AI 助理的结合,让用户可以像在电脑上浏览网页一样,在 ChatGPT 的对话中去实时唤起不同 App。沿着这个路径发展下去,浏览器未来可能只会作为一个帮助 AI 助理处理复杂任务的操作台存在,其入口地位会被 AI 助理所承接。
这也可以说明,为什么奥特曼不愿用「超级 App」,而是选择「超级系统」来描绘 OpenAI 的发展前景。因为 OpenAI 不是要为 ChatGPT 集成不同的功能,而是想围绕对话式交互,打造完善的账号体系、开发生态和商业模式,让 App 和 Agent 们都跑在 OpenAI 为其提前铺设好的轨道上。
现在,OpenAI 在进一步探索,如何通过对话式的交互,实现服务与信息的获取与分发,真正扮演好入口的角色。
不成熟但有新意的 Apps Inside ChatGPT
在 OpenAI 发布的信息中, Booking.com、Canva、Coursera、Expedia、Figma、Spotify、Zillow 是首批参与 App Inside ChatGPT 的伙伴。并且,在今年晚些时候会公布开发者如何通过应用盈利的细节。
但当我打开 ChatGPT 体验 App Inside ChatGPT 功能时,发现这个功能目前只能完成一些简单和粗糙的操作,并没有如预想中那样可以支持更为复杂的操作。
参照 OpenAI 在发布会上的演示,我在 ChatGPT 的对话框中让 Booking 帮我找几家北京的、可以提供停车位的酒店。然后会弹出将 ChatGPT 与 Booking 进行连接的授权界面,点击确认后会显示正在调用 App。然后就可以在聊天界面内嵌的 Booking 窗口中,看到几家酒店的推荐,每个酒店下面都会有跳转到 Booking 的链接。
奥特曼提到,OpenAI 本来可以设计出更流畅的使用体验,但这会对合作伙伴极为不利,所以他们选择将用户引导进原生 App 中。
「用户明确指定要使用某类服务时,我们会主动推荐合作方;合作方接管交互界面并关联用户账户,确保用户能与原服务保持直接、透明的连接。这种方式或许在用户体验的流畅度上略有妥协,但从长远来看,更有利于整个行业的健康发展。」奥特曼表示。
重新理解 AI 助理
在 OpenAI 目前选择的这条路径下,作为 AI 助理的 ChatGPT,扮演了最核心的角色。
所有的交互方式、开发工具和商业生态都是围绕这个核心来构建的。其中,对话是最主要的交互方式,未来点击、滑动可能只会作为辅助操作存在;开发工具则主要服务于应用生态的搭建;商业生态是开放的,可能会出现更多基于效果的分成机制。
这样的一个系统下,我们对于 AI 助理的理解会变得更为清晰。
第一,AI 助理就是要扮演管家的角色,负责统筹这个家庭中的不同工作人员,为主人提供服务。用奥特曼的话说就是,AI 助理的目标是提供单一且高效的 AI 服务,贯穿于用户的「整个生活轨迹并持续输出价值」。
这样的 AI 助理就需要横跨不同硬件端,有自主可控的模型能力,有长久记忆能力,以及拥有庞大用户体量。ChatGPT 的全球周活跃用户数已经达到了 8 亿,规模入口能吸引更多产品和应用嵌入到 ChatGPT 当中。
第二,AI 助理与浏览器的「主次关系」会变得更为明确。作为入口的 AI 助理会获得更大的主动性,浏览器则作为人与 AI 共用的操作台存在。Booking 目前在聊天框内嵌入的就是一个网页,那未来可能会在聊天框内唤起更复杂的网页,让人和 AI 助理能够基于网页呈现进行更效率更高的对话。
长期来看,Apps Inside ChatGPT 不能做到的复杂交互很可能会以 Agent 的形式在 ChatGPT 内实现。从 App 到 Agent 的发展,会很像微信小程序的发展过程,一开始垂类 App 只是将小程序作为功能简单的引流工具使用,但越往后小程序的功能就越与原生 App 相近。
OpenAI 推出的 AgentKit 能够支持用户可视化、零代码创建专业 AI 工具。而 Agent 搭建门槛的降低会加快 App 转化成为 Agent 的过程。未来人们最主要的交互可能就是和 Agent 的对话。这时的浏览器可能会从操作台演化为一个随时可以被唤起的看板,能够实时展示不同任务的执行情况。
并且,奥特曼还认为,C 端和 B 端对 AI 的应用,会比外界预期的更快走向融合,最终用户将拥有一款能覆盖所有场景的通用 AI 工具。这个工具事实上就是 OpenAI 要建设的超级系统。在这个系统中,作为账号的 ChatGPT 能够及时适配工作场景与生活场景不同权限、能力要求的切换,并调用不同的能力完成任务。
如果参照奥特曼的构想来衡量国内的头部 AI 企业,会发现字节的豆包更明显地在构建一个完善的 AI 系统能力,阿里、百度、腾讯则都还处于四处出击的阶段,没有在 AI 助理和浏览器之间形成合力,也没有积极地围绕 AI 助理进行 Agent 生态建设,以及探索 App 与 AI 助理的融合。
但腾讯还存在微信这个变量。微信本身就具备了庞大的用户体量、小程序生态和商业能力,并且在手机端和 PC 端也实现了打通,其搜索框也在向 AI 搜索框进化。只是,目前微信中缺少了一个 AI 助理。一旦微信的 AI 助理上线,将会轻易改变 AI 助理的现有竞争格局。