关于ZAKER 合作
钛媒体 12小时前

OpenAI 也来了,巨头为何决战 AI 浏览器?

文 | 定焦 One,作者 | 王璐,编辑 | 方展博

AI 浏览器赛道再添一位重量级玩家—— ChatGPT Atlas,这是 OpenAI 推出的首款人工智能驱动的网页浏览器。

这也被外界认为 OpenAI 要向谷歌宣战,挑战 Chrome 一直以来的浏览器霸王地位。ChatGPT Atlas 发布当天,谷歌母公司 Alphabet 股价应声下挫,盘中最大跌幅接近 5%,足见市场对这一新品的敏感度。

近一年来,AI 浏览器的战略价值成为行业共识,从业者更是将其与智能代理(Agent)、搜索引擎放在一起,并称为大语言模型(LLM)生态的三大核心基础设施,而 AI 浏览器是连接用户与 AI 能力的关键枢纽。

巨大的战略潜力催生了激烈的市场角逐,全球科技企业纷纷加速布局:

国内市场,腾讯和阿里分别升级 QQ 浏览器、夸克浏览器,360 也有 360AI 浏览器,大厂们抢先完成 AI 化转型;

国际市场,谷歌 Chrome、微软 Edge 两大主流浏览器已深度集成 AI 功能;Perplexity 的 Comet、The Browser Company 的 Dia(已经被 Atlassian 收购)、Fellou AI 的同名浏览器等独角兽公司的产品也各具特色。

如今 ChatGPT Atlas 加入战局,更是标志着全球头部玩家已全部集结,AI 浏览器行业的竞争进入白热化阶段。

作为 OpenAI 的重磅产品,ChatGPT Atlas 具备哪些亮点功能?与国内外同类 AI 浏览器相比,核心竞争力又体现在哪里?这一市场究竟有什么吸引力,让众多玩家纷纷押注?

OpenAI 的浏览器,亮点在哪里?

作为 OpenAI 推出的首款人工智能驱动的网页浏览器,其与传统浏览器的最大区别在于,面对用户抛出的问题,它会直接给出答案而非甩链接。

但这一点并非其独有优势,几乎市面上所有 AI 浏览器都能做到,ChatGPT Atlas 核心亮点在于,它围绕用户日常使用场景设计的四大功能。

首先是 " 上下文侧边栏 " 功能。

无论用户是想总结一篇长文的核心观点、分析网页里的数据图表,还是遇到专业术语想了解含义,不用手动复制粘贴内容,也不用在网页和 AI 工具间来回切换,只要点击 ChatGPT Atlas 里的「Ask ChatGPT」按钮,输入自身需求,ChatGPT 就能实时完成操作。

在右侧输入需求,ChatGPT Atlas 便能给出实时回复

其次是 AI 协助写作和编辑功能。

该功能的操作也十分简单,用户只要选中文本并输入要求,ChatGPT 可实时提供写作建议、语法检查和内容优化。

这一功能覆盖所有文本输入场景。比如 ChatGPT Atlas 发现语法错误会自动标注,认为语句不通顺会给出润色建议,用户写邮件时不知道如何表达,它也会根据收件人和场景调整语气,提升用户的内容创作的效率。

三是浏览器记忆功能。

该功能可以记住用户行为,比如自动保存用户访问过的网站上下文,从而基于浏览历史给用户提供个性化建议。

以购物为例,用户如果在双 11 期间经常逛购物网站,它便会根据过往浏览的商品类型推荐合适的新品。用户可以自主控制这些记忆,随时可以查看、删除,不用太过于担心隐私泄露问题。

四是 Agent(智能体)模式。

这是 ChatGPT Atlas 最受关注的功能。

可以简单理解为,ChatGPT Atlas 在获得用户授权后,可自主执行多步骤网络操作。

比如用户输入 " 帮我订一张下周一去北京最便宜的机票 " 的指令,Agent 在接收并理解需求后,会生成执行计划并展示关键步骤,由 Agent 在后台自动完成搜索、填写信息、提交订单等操作,用户无需手动操作。在整个任务执行的过程中,底部状态栏会显示进度,用户可随时点击 " 接管 " 或 " 停止 " 按钮干预任务。

Agent 模式下,ChatGPT Atlas 自主完成搜索加购等操作

此外,由于获得用户授权较多,在安全性上,ChatGPT Atlas 也增加了多重防护:禁止运行代码、下载文件及安装扩展,防范恶意程序入侵;访问金融、支付类敏感网站时,自动暂停 AI 操作并需手动确认;退出登录后,限制 AI 智能体权限,禁止访问私人数据。

不难发现,ChatGPT Atlas 的新功能不少,且不需要邀请码,使用门槛很低。从发布当日起,全球 ChatGPT 用户可在 chatgpt.com/atlas 下载 ChatGPT Atlas 的 macOS 版本。

但需要注意的是,部分功能需要花钱,ChatGPT 的免费、Plus、Pro 和 Go 用户可免费使用基础浏览功能,比如侧边栏、浏览器记忆,但 " 智能体模式 " 仅限 Plus、Pro、Business 用户使用。

ChatGPT Atlas,还不够聪明

ChatGPT Atlas 的推出,代表着 AI 浏览器行业进入了新的竞争阶段。一名从业者告诉「定焦 One」,市面上已有的 AI 浏览器产品,按照技术路线可分为两大类:集成技术路线(谷歌、微软以及国内绝大多数大厂)与 AI 原生路线(三大代表为:Comet、Dia、Fellou AI),ChatGPT Atlas 也属于此类。

两种路线的技术原理和功能实现存在明显区别:集成技术路线是在管理网页的基础上,加上了 AI 能力和 Chatbot 式交互,侧重信息交互与内容生成功能;AI 原生浏览器则在开发时就基于 AI 原生架构打造,是在 Chatbot 式交互和 AI 能力的基础上,加入网页管理功能。

两者最主要的区别在于智能化,后者更聪明,并集中体现在 Agent 能力上。

比如 Comet、Dia 可跨网站执行多步任务操作,Fellou AI 更是号称 " 全球首个行动型浏览器 ",例如,用户给出 " 在亚马逊搜 RTX4060 显卡,并按评分加购最高型号 " 的指令,Fellou AI 会自动执行 " 登录 - 筛选 - 比价 - 下单 " 整个过程。

与 Comet、Dia 等同类 AI 原生浏览器相比,最初外界看好 ChatGPT Atlas 的主要原因也在于智能化,认为其内置 ChatGPT 模型,能做到更聪明。

可以简单理解为,Comet、Dia、Fellou AI 代表了 AI 智能体的 " 任务自动化 " 能力,它们像是一位专业的、不知疲倦的助手,可以按照预设或生成的流程在多个网站间完成具体的操作,其核心价值是效率的提升和重复劳动的解放。而 ChatGPT Atlas 因为有了 ChatGPT,更像拥有一个强大的 " 大脑 "(ChatGPT 的推理和对话能力),从而与浏览器的 " 手脚 "(执行操作)进行联动。

但目前 ChatGPT Atlas 所展示出的功能,与其他 AI 原生浏览器并无太大差异。

比如在官方演示案例中,无论是工作场景中,用户通过一个简单的指令,让 AI 代理自动完成了一项涉及理解、协调和跨工具数据迁移的任务,还是生活场景中,根据人数调整菜谱、生成清单到自动备好购物车的全流程,ChatGPT Atlas 的 Agent 模式依然聚焦于 " 效率提升 ",没有展现出差异化。

从业者在测试中还发现了更多问题,例如它仅支持单次调用单个已打开的网页,而 Dia 已经能同时调用多个网页标签;ChatGPT Atlas 执行任务的速度也较慢,简单的在电商平台下单任务,也需耗时少到几分钟多则十几分钟,远慢于人工。

综合多轮实测结果,不止一位从业者认为,ChatGPT Atlas 的表现未达预期。

" 它(ChatGPT Atlas)最厉害的地方是生态,就像一个‘ ChatGPT 全家桶’,用户在浏览器里能聊天、写东西、让它帮你做事,不用来回切换工具。相比之下,Comet、Dia 等 AI 浏览器,虽然功能也比较强,但生态体系相对孤立,体验的流畅性就差了一些。" 一位从业者表示。

从事 Agent 应用算法方向研究的资深从业者赵江杰对「定焦 One」解释,ChatGPT Atlas 的核心优势,在于其依托 OpenAI 的基座模型、端到端 Agent 训练能力,以及庞大的用户生态,这三大能力是其他 AI 原生浏览器难以企及的。

具体来说,其他产品的基座模型要么使用闭源模型,要么基于开源模型进行微调,一般会使用两者混合的方式,闭源用来做高层规划,开源微调适配低层特定场景需求,但无论采用哪种方式,都很难与 OpenAI 的技术实力抗衡;同时,它们在 Agent 训练能力和用户基数上,也与 OpenAI 存在明显差距。

不过,这些优势需要通过长期使用才能充分显现。

赵江杰以记忆功能为例,用户初次使用 ChatGPT Atlas 时,数据积累尚处于空白阶段,此时产品自然无法深入洞察用户的个性化喜好,但随着用户使用时长和频次的增加,ChatGPT Atlas 将借助强大的推理能力,结合不断沉淀的用户历史数据,逐步精准判断用户偏好,不仅能补全用户未明确表达的隐性需求,还能准确理解用户表述中的模糊指令,实现更贴合需求的服务。

AI 浏览器,下一代互联网入口

从目前的表现来看,ChatGPT Atlas 还谈不上惊艳,但推出 AI 浏览器,是 OpenAI 和国内大厂不得不走的一步棋。多位从业者认为,这背后是对行业格局、生态构建与数据价值的深层考量。

首先是战略上,OpenAI 想要抢占 AI 时代的 " 第一入口 "。

一直以来,谷歌凭借 Chrome 浏览器,构建了覆盖全球的流量入口与数字广告霸权。第三方数据平台 Statcounter 统计,截至 2025 年 7 月,Chrome 仍占据全球浏览器市场 67.9% 的绝对份额,活跃用户超 30 亿。

这种主导地位使得谷歌牢牢掌控着用户行为的 " 第一入口 ",以及随之产生的海量数据。

OpenAI 推出 Atlas,根本目的是想改变这一游戏规则。用户无需自己用关键词搜索,而是让 AI 直接给答案、完成任务。当用户习惯了这种更省事的方式,自然会减少传统搜索的使用次数,相当于从源头上分流了谷歌的用户,从而争夺 AI 时代的 " 入口 "。

这一入口还可以让 OpenAI 构建自己的 AI 生态和更多商业化机会。

在互联网早期,浏览器因聚合搜索、社交、购物等核心功能成为用户上网的主要入口,而在 AI 时代,浏览器进化为融合大模型(大脑)、长期记忆(数据)与 Agent(手脚)的载体,为模型及其工具的使用提供运行环境,特别是浏览器与 Agent 强相关,Agent 在不同应用之间完成访问登录网站、浏览电脑文件等任务时,都需要借助浏览器这一环境。

比如,在工作场景上,用户在 ChatGPT Atlas 完成从信息获取、分析、处理到输出成果的全链条工作 ",在生活场景上,ChatGPT Atlas 把搜索 - 比价 - 下单全流程绑在一起,让用户不用再切换多个 APP。这种由 Agent 自动化过程中对浏览器工具链、应用生态的深度集成使用,能创造出一种 " 全场景 " 下的生态闭环。

赵江杰表示,ChatGPT Atlas 可以让 OpenAI 在用户订阅、API 调取等收费形式之外,找到更多商业化途径。

相比单一聊天工具(ChatGPT) ,覆盖用户全场景行为的 ChatGPT Atlas 能获取更完整的用户行为数据(尤其是和消费、决策相关的轨迹)。这些数据能让广告推荐更精准、商业转化的归因更清晰,进而开辟广告投放、商业分成、场景化付费等新的变现途径。

最后是数据反哺。

用户在浏览器中每一次搜索查询、页面停留、点击决策乃至操作纠错,背后都代表的是其真实意图与偏好的高质量数据,这些实时的、连续的用户数据,对于大模型监督微调和强化学习至关重要。

ChatGPT Atlas 的存在让 OpenAI 可以在自有浏览器中直接捕获这些数据,从而精准评估模型表现、发现问题并快速修复。不仅能优化 ChatGPT Atlas 这一产品,更能反哺 GPT 核心模型,形成一个 " 产品更好用 - 用户和数据更多 - 模型更强 " 的循环。

国内大厂纷纷布局 AI 浏览器的战略目的,与 OpenAI 有相似之处。短期是处于 " 防守 " 考虑,目前 ChatGPT 等 AI 工具正改变着用户的搜索习惯,越来越多用户减少了对传统浏览器搜索结果的依赖,大厂将自身的传统浏览器升级,能保护自己现有的流量和业务基本盘,而长期来看,大厂也希望借助 AI 浏览器找到更多商业机会。

AI 浏览器,是一场持久战。

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容