文 | 定焦 One,作者 | 王璐,编辑 | 阿伦
近期,一则 " 悬而未决 " 的竞购在 AI 圈引发轰动。
靠 AI 搜索成为行业独角兽的 Perplexity 称要以 345 亿美元的价格收购谷歌的 Chrome 浏览器,这一报价几乎是 Perplexity 自身估值(180 亿美元)的两倍。想买 Chrome 的还不止 Perplexity,另一家 AI 明星企业 OpenAI,此前也透露出了收购意愿。不过,谷歌方面暂时没有接受任何报价。
看到这个新闻,很多人不由得发出疑问:浏览器,这个 " 老掉牙 " 的互联网产品,怎么又重新 " 性感 " 起来了?
不止国外,国内互联网大厂近一年来也都围绕浏览器做文章。腾讯、阿里、360,分别押宝 QQ 浏览器、夸克浏览器、360AI 浏览器,想要打造 "AI 时代的超级入口 "。
有必要讨论:当 AI 遇上浏览器,会发生什么化学反应?AI 浏览器,为什么能成为大厂和创业公司在 AI 时代的战略重心?这场争夺赛,谁最有可能占得先机?
AI 浏览器的两大流派:界面、功能各不相同
什么是 AI 浏览器?
可以理解为将 AI 融入到传统浏览器中,具备智能搜索与问答、内容理解与生成摘要、自动化任务执行、多模态交互体验、个性化推荐等功能,实现从 " 工具 " 到 " 智能 " 的转变。
很多从业者认为,AI 浏览器和 Agent 一样,都属于大势所趋,但此刻大家围绕 AI 浏览器的谜团也有很多。
目前各家公司在 AI 浏览器的技术路线与产品形态上有着明显区别,究竟何种形态才能称之为 AI 浏览器?它和 Chatbot、Agent 在功能和技术上又有何区别?
先看竞争比较激烈的国外市场。
谷歌和微软这两大科技巨头均推出了 "AI 浏览器 ",前者让 Chrome 浏览器直接集成了 AI 能力,从而对用户搜索内容进行总结提炼。后者则在原有 Edge 浏览器的基础上推出了 Copilot 模式,启用该模式后,Edge 浏览器的新标签页会变成一个简洁的输入框,用户可以直接和 AI 对话。
但与传统版本相比,两家 AI 浏览器的整体界面形态变化不大。
从事 Agent 应用算法方向研究的资深人士赵江杰表示,谷歌和微软均采用的是集成技术路线打造 AI 浏览器,即把 AI 作为独立模块融入到传统浏览器架构中,可以简单理解为,在管理网页的基础上,加上了 AI 能力和 Chatbot 式交互。
另一种为 AI 原生路线,多为 AI 初创公司采用。
比如 Perplexity 的 Comet、TheBrowserCompany 的 Dia 浏览器以及 FellouAI 的同名浏览器," 这些产品在开发时便基于 AI 原生架构打造,和集成模式不同,它是在 Chatbot 式交互和 AI 能力的基础上,加入网页管理功能。界面设计大多采用对话框形式,凸显了 AI 交互的核心地位。" 赵江杰表示。
再看国内,目前公开宣布研发 AI 浏览器的主要为互联网大厂,"AI 六小虎 " 为代表的大模型初创公司尚未公布相关动作,赵江杰透露,除夸克外,国内大厂的 AI 浏览器基本都采用的是集成模式。
除了界面存在差异,各家 AI 浏览器的功能侧重点也不太一样,区别在于智能化水平。
目前大多数 AI 浏览器可以理解为非自主型,较传统浏览器相比,AI 功能体现在能完成网页总结、生成框架图、推荐相似网页、网页翻译、文字续写、语音助手。
比如 360AI 浏览器比较突出的功能有总结概括长视频内容,快速梳理出重点概念并生成脑图。阿里的夸克浏览器支持在文字之外制作 PPT、生成图片等多模态能力。
总体来看,国外的 Chrome 以及国内绝大多数的 AI 浏览器,基本都以上述信息交互与内容生成功能为主。
另一类偏自主型 AI 浏览器,能自主完成多网页读取与分析、自主操作复杂任务,以及预测用户的个性化需求。
比如国外的 Comet、Dia 可跨网站执行多步任务操作,FellouAI 更是号称 " 全球首个行动型浏览器 ",用户给出 " 在亚马逊搜 RTX4060 显卡,并按评分加购最高型号 " 的指令,FellouAI 会自动执行 " 登录 - 筛选 - 比价 - 下单 " 整个过程。
目前自主型 AI 浏览器是 AI 初创公司主打的功能方向。
在赵江杰看来,自主型 AI 浏览器更加智能,不过他也强调,即便自主型 AI 浏览器看起来做到了智能化,但功能也比较基础,目前成熟场景主要有三种:多标签页信息对比总结、自动搜索并回复社交媒体发帖、监控 Gmail 邮件反馈以及跨境电商自动报价等商用场景。总之,是辅助用户处理一些重复性的工作。
Agent 带飞浏览器
在互联网早期,因为具备搜索、社交、购物等多样功能,浏览器曾是用户上网的主要入口。
2000 年前后,微软的 IE 浏览器(Internet Explorer,后被 Edge 取代)凭借 Windows 系统预装垄断市场,份额一度高达 95%。到了移动互联网时代,随着苹果硬件畅销、谷歌安卓系统被广泛使用,苹果的 Safari 浏览器和谷歌的 Chrome 浏览器不断蚕食 IE 浏览器的地盘。
根据市场调查机构 Statcounter 最新公布的数据,在全球所有平台中,Chrome、Safari、Edge 的市场份额分别为:67.9%、16.2%、5.1%。在国内,除了三巨头之外,360 浏览器、QQ 浏览器、UC 浏览器也有一定的市场份额。
然而,这些年浏览器们的日子并不好过。因为在移动时代,浏览器的入口地位被 APP 严重削弱,只有在访问陌生网站、临时查信息等场景下,浏览器还有一点存在感。
到了 AI 时代,本来以为,被 Chatbot 接替了部分功能的浏览器,地位会更加岌岌可危。然而,随着 Agent 的爆发,浏览器彻底 " 翻红 " 了。
石榴 AI 首席研究员、大模型从业者张恒认为,浏览器被重新重视,主要是因为它的 Agent 入口地位。
据了解,大模型的产品形态由简单到复杂可分为:Chatbot(对话机器人)、Copilot(智能助手)、单智能体和多智能体,后两者被统称为 Agent。如今以 ChatGPT 为代表的 Chatbot 类产品,弊端越来越明显,比如:用户能否提出明确指令,直接影响回复的准确度与完成度,同时 Chatbot 自身缺乏长期记忆与连续性,这在一定程度上降低了大模型的智能水平。
相比之下,Agent 则像个有自主意识的智能助手,能帮用户琢磨事、做计划、动手干活、规划行程、完成报告等等,且具有自主性和通用性。
而这些功能的实现,绕不开浏览器。
赵江杰表示,目前 Agent 的开发场景主要有两种,一种是垂直领域,比如完成做视频这种单一任务,只需生成视频片段并做拼接,操作比较简单,或者专门针对某一企业,只服务于公司内部系统,不用跨其他平台。
另一种则是 toC 场景,比如常见的网购、订票,这种涉及可视化界面和跳转到其他网站的功能,都得依靠浏览器。
简言之,浏览器是 Agent 的 " 舞台 ",帮它在不同应用之间进行操作,从而完成访问登录网站、浏览电脑文件等复杂任务。" 大模型像人的脑子,Agent 是手和脚,浏览器就是手脚和脑子一起干活儿的地方,在执行一项复杂指令时,需要大模型、Agent 和浏览器三者协作完成。" 他表示。
以购买一双跑鞋为例,用户下达这一指令后,大模型作为大脑接收、理解 " 买跑鞋 " 的任务,Agent 作为手脚行动将其拆解为 " 比价 "" 购买 " 等多个子任务执行,而其在操作时需要通过浏览器打开淘宝、京东这些网站。
赵江杰认为,Agent 的关键在于高效完成任务并交付结果,而浏览器作为本地环境,天然具备访问用户本地数据和操作权限的能力,能直接读取用户的登录状态、已安装的插件、本地存储的数据等必要信息,从而显著提升 Agent 完成任务的质量和准确性。
而且,将浏览器作为 Agent 入口,用户无需将账号密码等个人信息交给第三方 AI 工具,降低了泄露用户隐私的风险。
总之,如果 Agent 有未来,浏览器也会有未来。
AI 浏览器的喜和忧
浏览器不仅是 Agent 入口,在整个 AI 生态中也占据着重要位置。
张恒表示,浏览器减少了 AI 需要适配的终端类型,是 AI 应用的统一入口,比如,浏览器使 Copilot 的功能开发更聚焦,用户无需在多个应用或设备间切换,提升了使用便捷性。
意识到了浏览器对于 AI 产品的独特价值,Perplexity 等 AI 独角兽,不仅自研 AI 浏览器,还要花高价收购 Chrome。综合从业者的说法,竞购的目的主要有两点。
一是抢市场份额。
据第三方数据平台 Statcounter 统计,截至 2025 年 7 月,Chrome 在全球浏览器市场的份额为 67.9%,拥有超过 30 亿活跃用户,可见其主导地位。
在张恒看来,海外的浏览器三巨头,Edge 主要适配 Windows 系统,Safari 依托苹果设备的封闭生态,而 Chrome 凭借跨平台兼容性、丰富的插件生态和与谷歌服务的深度整合,市占率最高,这就意味着 AI 初创公司只要掌握了 Chrome、占有了 Chrome 产品,也就相当于拥有了大批用户,比自己做浏览器从零积累要快得多。
而且,做一个具有强兼容性和丰富生态的浏览器,复杂度等同于操作系统。" 想要再自研一个类似于 Chrome 的浏览器难度巨大,市面上大多数浏览器都为 Chrome(Chromium)套壳。" 赵江杰表示。
二是通过浏览器积累用户数据。
用户在浏览器上的每一次搜索、每一次停留、每一个纠错反馈,都是珍贵的数据信息," 研发团队不仅能及时根据用户反馈优化 AI 模型,也可以用来改进 AI 产品,让产品变得越来越‘懂’用户。"
不过,与传统浏览器相比,AI 浏览器目前也有明显弊端,一是会和 Chatbot 一样出现 " 幻觉 ",二是生态尚未成熟。
所谓 " 幻觉 ",就是 AI 会一本正经地胡说八道,编造出看似合理但根本不存在的信息,这主要是由于浏览器的信息生成、内容总结功能,都依赖大模型完成。换句话说,幻觉的根源是大模型,AI 浏览器自身无法降低幻觉。
生态未成熟可以理解为配套问题,"AI 浏览器要理解网页,要么靠截图,要么靠解析 DOM 树(网页的结构化表示方法),但截图会漏掉如下拉菜单这类隐藏元素,解析 DOM 树又很耗费计算资源。而且现在的图像识别技术,还没法像人一样顺畅地操作复杂网页,也会触发验证码之类的安全验证,这些都让 AI 浏览器用起来不够顺畅。" 赵江杰表示。
以上种种问题共同导致 AI 浏览器在实际应用中面临效率低、可靠性差等挑战,限制了其在复杂场景下的广泛应用。
在使用习惯上,AI 浏览器也面临着不小的挑战。
一位从业者认为,传统浏览器的核心操作逻辑是 " 用户主动搜索 + 筛选 ",老用户已经习惯了在地址栏输网址或输入关键词、点链接跳转,相比之下,AI 浏览器更像 " 主动服务 ",用户能否适应这一转变也不一定,这也是传统搜索公司面对 AI 浏览器这块 " 香饽饽 " 时格外谨慎、不敢贸然推出颠覆性的 AI 浏览器的原因,即便是推出了 AI 浏览器,也保留着传统浏览器的操作界面。
目前,从业者更倾向于构建 "AI 浏览器— Chatbot — Agent" 的协同生态,实现各司其职的高效分工,三者的功能边界与应用场景有所区分,AI 浏览器提供信息检索和展示,方便用户快速获取信息;Chatbot 一方面侧重获取信息的基础功能,另一方面完成文本生成、知识问答等更细节性的任务,但不执行实际操作;Agent 则是思考 + 操作,侧重自动化办公、数据分析等复杂任务。
比如用户想做一个假期带娃出游计划:可以用 AI 浏览器爬取 OTA 平台、景区官方等平台信息,筛选出适合带娃的景点以及路线,然后自己做规划;也可以让 Chatbot 给出某地某项目适合多少岁的孩子玩等具体规划,但自己买票;或者直接用 Agent 给出整体规划并直达交付链条,即用户接收确认景点门票的订单链接。
简言之,同样是做假期带娃出游计划,AI 浏览器负责给用户整理信息包,Chatbot 给用户提供详细的建议和文案,Agent 不仅给建议,还帮用户进行预约、下单,三者的核心差异在于 " 提供的服务深度 " 和 " 是否能自主操作 "。
不过,虽然浏览器已在 AI 时代展现出独特价值,但仍然有很多问题等待解决。
而眼下这场轰轰烈烈的 "Chrome 争夺战 ",最终的赢家,不仅会重写浏览器的市场格局,更有可能主导 AI 时代的数据主权和技术标准。
回到故事原点,美国司法部以反垄断的理由,竭力想让谷歌卖掉 Chrome,但 " 手握重器 " 的谷歌,一定知道 Chrome 的价值,也一定会尽力使 Chrome 免于分拆。
那些想通过收购 Chrome 一飞冲天的 AI 公司,恐怕还得继续眼馋。