北京时间 10 月 22 日凌晨,没等来传闻中的 Gemini 3,等来了 OpenAI 正式发布首款 AI 浏览器 ChatGPT Atlas。
简单来说,这是一个把 ChatGPT" 塞进 " 浏览器的产品,你在任何网页上都能随时唤出 ChatGPT 侧边栏,让 AI 帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。
听起来有点像 Chrome 装了个 ChatGPT 插件?确实如此,但 OpenAI 的野心远不止于此。
有趣的是,OpenAI 正是用一个长得最像 Chrome 的浏览器,来挑战 Chrome,用你最熟悉的方式打败你。ChatGPT Atlas 没有选择激进的界面革新,也没有太多功能创新,而是保留了多标签、地址栏这些用户习以为常的元素,只是把 AI 放到了浏览的中心位置。
那么,ChatGPT Atlas 究竟有哪些功能?它和市面上已有的 AI 浏览器相比,又有什么不同?
让 ChatGPT 无处不在的浏览体验
侧边栏:ChatGPT 随时待命
ChatGPT Atlas 最核心的设计是将 ChatGPT 深度嵌入浏览器。在任何网页上,用户都可以点击 Ask ChatGPT 按钮,唤出一个侧边栏。这个侧边栏自动获取当前页面的上下文,用户可以直接要求 ChatGPT 总结代码差异、比较产品参数、分析文章观点,无需再复制粘贴内容。
类似的是 Cursor Chat 功能,在网页的任何文本框中,用户用光标选中文字后可以直接调用 ChatGPT 进行内联编辑。比如在 Gmail 写邮件时,选中一段话,让 ChatGPT" 整理我的语言 " 或 " 改成更正式的语气 ",修改后的文本直接替换原文。这确实省去了在多个标签页之间来回切换的麻烦。
ChatGPT Atlas 引入了 " 浏览器记忆 " 功能,这是它与传统浏览器的重要区别。它不只记录你访问过哪些网站,还会记住你在页面上的操作行为,看了什么内容、对比了哪些产品、完成了什么任务。
这意味着你可以用自然语言搜索历史,比如问 " 找出我上周看过的所有职位招聘,并总结行业趋势 ",ChatGPT 会调用这些记忆给出个性化的分析。CEO Fidji Simo 在博客中举了个例子,她经常浏览无麸质食谱,现在可以直接让 ChatGPT" 根据我最近看的食谱制定本周菜单 ",并通过 Agent 模式在 Instacart 上自动下单。又是菜谱?看来 OpenAI 对 " 根据食谱买菜 " 这个场景情有独钟。
记忆功能本来就是 ChatGPT 率先推出的特性,迁移到浏览器是自然的延伸。但问题在于,这需要用户对 OpenAI 有足够的信任,毕竟,让 AI 记住你的所有浏览操作和行为,听起来就像在网上 " 裸奔 "。
Agent 模式:本地版 Operator
对于 Plus、Pro 和 Business 订阅用户,ChatGPT 提供了 Agent 模式。这是一个可以代表用户执行任务的 AI 代理,它能打开标签页、点击按钮、填写表单、完成购物流程。可以简单理解为本地版的 Operator。它在 Atlas 的标签页里行动,而不是像 Operator 那样用一台云端的独立浏览器。
发布会上的演示场景包括根据食谱计算八人份配料并在 Instacart 下单、在 Google Doc 中添加评论并转换为 Linear 任务。又是订票、买菜、订餐厅。这些演示场景从 Operator 发布时就在用,已经不新鲜了。
经过我们的测试,目前的网页 AI 代理在简单任务上表现尚可,但处理复杂问题时仍不够可靠。OpenAI 自己也承认,Agent 可能会犯错,甚至可能受到网页中隐藏的恶意指令影响。OpenAI 强调 Agent 是 " 协作式 " 的,用户可以随时监控进度或接管控制权。
安全方面,Agent 仅在用户的标签页内运行,不能在计算机上执行代码或访问文件系统。在金融网站等敏感场景,它会暂停并等待用户确认。用户也可以选择 " 登出模式 ",限制 Agent 访问已登录的账户数据。
它和其他 AI 浏览器最大不同,就是它是 OpenAI 发布的
AI 浏览器赛道已经相当拥挤。Perplexity 的 Comet 主打 AI 侧边栏和多步骤任务自动化,还有能主动给出洞见的背景助手,同样免费开放,Microsoft Edge 的 Copilot 模式整合了聊天和搜索功能,支持多标签对比和语音控制,与微软生态深度绑定;The Browser Company 的 Dia 则更注重界面美学和工作流优化,强调与标签对话的能力,可以作为写作伙伴和个人助理。
在体验上,接下来它还需要证明自己不只是 Chrome 加了个 ChatGPT 插件。毕竟 Edge 早就引入了 Copilot,而 Chrome 也可以轻易加入 Gemini 侧边栏,Gemini 光标、Agent 模式,还有着庞大的用户基数和生态优势。
在 OpenAI 的思路里,你也能看到,他们强调的 Atlas 的亮点之一,就在于与 ChatGPT 账户的深度整合,浏览器可以调用用户在 ChatGPT 中的历史对话和偏好设置,实现跨设备、跨平台的一致体验,跨会话、跨网站的记忆系统也不只是单次对话的上下文,对于重度 ChatGPT 用户来说,有了它至少可以少开一个应用,也不用跨窗口复制粘贴了。
OpenAI CEO Fidji Simo 在博客中阐述了发布 ChatGPT Atlas 的意图," 我们希望 ChatGPT 从一个孤立的、被动的文本聊天界面,演变为一个直觉化的超级助手,连接你需要的所有服务。" 她提出了 ChatGPT 将成为你生活的操作系统。而浏览器是这一战略的关键节点,因为它是大多数人获取信息、完成任务的入口。
也就是说,OpenAI 的 Atlas 最大的 " 不同 ",就是它是由 OpenAI 发布的。
ChatGPT Atlas 带来的是 ChatGPT 整个生态的能力与用户关系。这使得它是第一个可以不只在 Chrome 设定的规则内进行功能修补,而试图从根本上改变人们对浏览器的使用逻辑的产品——它要在已经被 ChatGPT 塑造了使用习惯的数亿用户的基础上,把浏览体验的核心从谷歌的搜索引擎,转移到 OpenAI 的 AI 模型上。
这本质上还是 OpenAI 要把 ChatGPT 打造成未来全知全能的操作系统的路线里,必要的一步。
用一个最像 Chrome 的样子,对用户来说熟悉的界面几乎没有学习成本;而对竞争对手,尤其是谷歌而言,这算是一个真正的警告了。接下来可以预期的是,它会迫使谷歌、微软等巨头更快速地将 AI 深度整合进自己的浏览器产品。所有人都会卷入 OpenAI 的 AI 时代操作系统之争中去。