
OpenAI 发布了新一代人工智能模型 GPT-5.4。公司称,这是其迄今为止面向专业场景能力最强的人工智能系统。该模型融合了高级推理能力、编程能力以及自主操作计算机和软件的功能,使企业级人工智能市场的竞争陷入白热化,而这一领域此前一直是 Anthropic 的优势阵地。
新模型整合了 OpenAI 此前分散在不同模型中的多项能力,集成了公司领先编程模型 GPT-5.3-Codex 的编程能力、更强的推理能力,以及模型能够自主在桌面、浏览器和软件应用之间操作的智能体能力。
该模型于 3 月 5 日向 ChatGPT Plus、Team 和 Pro 订阅用户推出,同时通过公司的 API 开放。针对需要处理复杂任务、追求更高性能的用户,OpenAI 还提供了更强版本 GPT-5.4 Pro。
在发布模型的同时,OpenAI 还宣布推出 Excel 和 Google Sheets 版 ChatGPT(测试版)。该版本将 ChatGPT 直接嵌入电子表格中,可以用于构建、分析并更新复杂的财务模型。公司还发布了一系列新的 ChatGPT 应用集成,包括 FactSet、MSCI、Third Bridge 和穆迪(Moody ’ s),旨在让团队能够将市场数据、公司数据以及内部数据整合到同一工作流程中。
此举也让 OpenAI 与竞争对手 Anthropic 展开了更直接的较量。Anthropic 在 2025 年 7 月推出了面向金融行业的 "Claude 金融服务版 "(Claude for Financial Services)产品,并在当年晚些时候进一步扩展相关功能。两家公司正在竞相争夺企业市场,面向已经准备好采用人工智能的行业推出可以完成实际工作的工具。
新模型的发布还可能引发投资者对人工智能冲击传统金融数据提供商的新一轮担忧。由于市场普遍担心人工智能将颠覆企业软件行业,这类公司的股价此前已经受到影响。今年早些时候,Anthropic 发布 Cowork 插件后,市场一度出现大规模抛售 SaaS 股票的情况,因为投资者担心人工智能工具可能让传统软件供应商被淘汰。
新智能体能力
对于企业用户而言,GPT-5.4 最重要的升级之一是其 " 开箱即用 " 的智能体能力。该模型可以自主操作计算机和软件,根据需要搜索并调用外部工具,还能够处理复杂的多步骤任务,而开发者无需自行搭建相应的底层架构。
OpenAI 表示,GPT-5.4 是公司迄今最注重事实、最可靠性的模型。公司在一篇博客文章中称,与 GPT-5.2 相比,该模型产生 " 幻觉 " 的概率明显下降:单个陈述出现错误的可能性降低 33%,完整回复包含错误的概率降低 18%。
GitHub 的首席产品官马里奥 · 罗德里格斯在评价该模型时说:" 开发者不仅需要一个可以写代码的模型,更需要一个能够像他们一样思考问题的模型。我们看到 GPT-5.4 在逻辑推理以及执行复杂、多步骤、依赖工具的工作流程方面表现非常出色。"
这些新功能使 OpenAI 在竞争日益激烈的智能体产品领域中,成为更直接的参与者。当前市场上的类似产品包括 Perplexity Computer、微软(Microsoft)的 Copilot Tasks 以及 OpenClaw。近期 OpenClaw 的走红也表明,用户越来越青睐可以在尽量减少人工干预的情况下处理长工作流程的人工智能系统。
OpenAI 还指出,与此前的模型相比,GPT-5.4 在词元使用效率方面有明显提升,也就是说它能够用更少的词元解决问题。虽然该模型每个词元的定价略高于 GPT-5.2,但由于完成许多任务所需的词元数量更少,对于部分用户而言,这种效率提升可能抵消价格上涨带来的成本。(财富中文网)
译者:刘进龙
在财富 Plus,网友们对这篇文章发表了许多有深度和思想的观点。一起来看看吧。也欢迎你加入我们,谈谈你的想法。今日其他热议话题: