近日,谷歌 Gemini 超越 ChatGPT,强势登顶苹果美区 App Store 免费应用榜。
Gemini 这一轮 " 逆袭 " 的最大功臣,是谷歌 8 月底推出的代号为 Nano Banana(纳米香蕉)的 AI 图像生成与编辑模型。
它的火爆程度远超想象:谷歌实验室副总裁 Josh Woodward 透露,Nano Banana 上线仅一周,就完成了超 2 亿次图像编辑,并吸引超 1000 万新用户涌入 Gemini 应用。其火爆程度一度导致谷歌内部 "TPU(张量处理单元)严重过载 "。
《每日经济新闻》记者实测发现,Nano Banana 的图像生成能力的确强大,实现了复杂图像编辑技术的 " 大众化 ",让普通用户能用简单的语言完成以往需要专业软件才能完成的任务。
Nano Banana" 出圈 " 的背后是谷歌十年打磨自有算力芯片、整合全生态资源的努力。凭借谷歌 " 硬件自主 + 生态渗透 " 的双重护城河,一场关于 AI 时代话语权的争夺战,正借一根 " 香蕉 " 正式打响。
图片来源:每经记者 郑雨航 摄
Nano Banana 一周 " 吸粉 " 千万,Gemini 登顶多国榜单
一直以来,ChatGPT 都是 AI 应用领域不可撼动的霸主。不过,这一格局正在被谷歌打破。
最新数据显示,在美区 AppStore 中,谷歌 Gemini 的下载量已超过 OpenAI 的 ChatGPT,成为免费榜排名第一的应用。此外,在加拿大、印度、摩洛哥等国家,Gemini 同样实现了登顶。
市场分析普遍认为,Gemini 此轮爆发的最关键因素,是谷歌在 8 月底推出的新一代 AI 图像生成与编辑模型 Gemini 2.5 Flash Image,其代号为 Nano Banana。Nano Banana 在图像质量、编辑控制和应用场景上有大幅改进,一推出就受到了用户的热烈追捧。
模型上线一周后,谷歌实验室副总裁 Josh Woodward 透露,Nano Banana 累计完成超 2 亿次图像编辑,带动超 1000 万新用户涌入 Gemini 应用,其火爆程度甚至导致谷歌内部 "TPU 严重过载,SRE(站点可靠性工程)警报不停 "。
蜂拥而来的用户让 Nano Banana 几乎刷屏了全球各大社交媒体。这一幕,像极了数月前 GPT-4o 凭借 " 吉卜力 " 风格创作风潮的刷屏景象。当时,OpenAI 的 CEO 奥特曼也曾表示,ChatGPT 在 " 吉卜力效应 " 当周创下了活跃用户、App 下载和订阅收入的历史纪录。
如今,Nano Banana 正为谷歌复制这一成功路径。DeepMind CEO 哈萨比斯在最新采访中也表示,Nano Banana 是同类产品中最好的。
应用端的火爆,迅速传递到资本市场。受益于 Nano Banana 的良好市场表现及其他利好因素,谷歌母公司 Alphabet 股价近期持续上涨。当地时间 9 月 15 日(周一)收盘,Alphabet 的市值达到 3.05 万亿美元,成为全球第四家市值突破三万亿美元大关的公司。
华尔街也迅速跟进。同日,花旗集团分析师 Ron Josey 将 Alphabet 的目标股价从 225 美元上调至 280 美元,明确指出Gemini 在广告和云业务中的采用加速,正带来更快的产品开发周期。
实测 Nano Banana:图片生成能力卓越,但仍有短板
Nano Banana 之所以能引发 " 病毒式 " 传播,绝非仅仅是营销的胜利,其核心在于它实现了复杂图像编辑技术的 " 大众化 ",将以往需要专业软件才能完成的任务,转变为普通用户通过自然语言就能轻松实现的操作。
从技术拆解来看,Nano Banana 本身具备多个 " 杀手锏 "。
据谷歌官方博客,其核心能力包括——
多图像融合:将不同的图像组合成一张 " 毫无 PS 痕迹 "、具有新视觉效果的图片。
角色和风格一致性:在多次生成过程中,保持主体对象或视觉风格的统一,能够轻松将同一角色或产品置于不同场景中,且保持原始特征。
对话式编辑:用户可以通过简单的对话对图像进行更改。
在实际体验中,全球用户用 Nano Banana 玩出了各种花样。其中,最出圈的就是生成 3D 手办图片。用户上传自家宠物或自己的照片,下令生成手办图像,Nano Banana 就能给出逼真的建模图以及成品图。
记者实测发现,只要上传一张宠物照片,再输入将图片转成手办的提示词,即可生成一张高清逼真的 3D 宠物手办图片。
多元素拼接这个玩法也十分火爆。用户可以上传一张包含多个元素排布的图片,并给图中物品打好标签,模型便能将其融合成一张统一的图片。
不过,记者实测发现,Nano Banana 也存在明显短板。比如,生成的汉字经常乱码。当记者要求模型生成一张带有 " 每日经济新闻 " 几个汉字的海报时,总共六个汉字,Nano Banana" 写 " 对了四个。
当然,Gemini 并不仅仅是一个 P 图工具,它是一个定位与 ChatGPT 相同的通用助手。近期爆火的 Nano Banana 只是其功能之一。
除了 Nano Banana,Gemini 还集成了诸多能力,比如——
记忆功能:补齐了跨对话的 " 记忆 " 功能,可以保存用户偏好,例如 " 我是素食者,不要推荐带肉的食谱 "。
音频上传:Gemini 近期终于支持上传音频文件。这意味着用户可以把会议录音、采访视频等直接交给 Gemini 处理,省去手动整理的麻烦。
Canvas(画布):类似于 ChatGPT 的画布预览功能,可以将创意变为应用程序、游戏等。该功能近期也获得更新,支持 " 选择并询问 "(Select and Ask),用户可直接点击应用预览中的某个元素,用自然语言修改它。
视频生成:集成了 Veo3 视频生成功能(预览版)。
Deep Research:提供深度研究功能。
Gemini 登顶背后:谷歌的双重 " 护城河 "
在 Nano Banana 的火爆和 Gemini 登顶多国榜单的背后,是谷歌十年打磨自有算力芯片、整合全生态资源的必然结果。
TPU 自主:比英伟达方案省 20% 算力运营成本
谷歌手中握着一张经常被市场低估的 " 王牌 " —— TPU。自 2015 年起,谷歌便开始研发其专为加速机器学习工作负载而设计的定制芯片 TPU。
据谷歌介绍,中央处理器(CPU)被设计为计算机的通用 " 大脑 ",而 GPU 当时是专门设计用于与 CPU 协同工作以加速图形、视频渲染和模拟中的复杂任务的专用芯片,TPU 则是专为 AI 而设计的。在此后的十年中,TPU 的性能和效率不断进步,并逐渐成为谷歌几乎所有产品的 AI 支柱。
这种 " 垂直整合 " 的打法,让谷歌成功摆脱了对英伟达(Nvidia)等第三方硬件供应商的 " 算力枷锁 ",从而规避了全球 GPU 供应链的瓶颈和高昂成本。
英伟达最新财报显示,其毛利率高达 72.4%,这也意味着,依赖英伟达芯片的公司需要为算力支付一笔高昂的溢价,而谷歌凭借自有 TPU,自然跳过了这层加价。
分析师估计,与依赖英伟达 GPU 的公司相比,谷歌运营其 TPU 基础设施的成本要低约 20%。
从 App 到智能体,Gemini" 无处不在 "
硬件之外,谷歌正火力全开,利用其生态系统,将 Gemini 强势嵌入其中。
Gemini 并非一个孤立的应用,而是被全面 " 武装 " 到谷歌的整个产品矩阵中:在安卓系统上,它接管 "Hey Google" 语音助手的大脑;在 Google Workspace(文档、Gmail、表格)中,它化身智能辅助;在谷歌搜索中,它驱动 AI 概览(AI Overviews)功能。
谷歌的愿景远不止于此,更要打响 " 智能体 " 战役。其 " 智能体平台 "(Agentic platforms)如 Agentspace,允许企业客户将 Gemini 与其内部数据和系统相连接,创建能够自动执行复杂工作流的定制化 AI 智能体。
谷歌首席执行官桑达尔 · 皮查伊(Sundar Pichai)在 2025 年战略中明确指出,未来的重点是扩大 Gemini 作为主要用户交互界面的规模,这预示着谷歌正从传统的搜索框模式,向一个更集成、多模态和智能体化的 AI 体验转型。
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
每日经济新闻