现在,更强大的 Gemini 3.0,已经在 Google AI Studio 的测试里「提前上线」。
网友们发现,它的能力提升不止一星半点,能直接用一套简单的提示词生成一个网页版 Windows、macOS 等。
这有可能是 Gemini 继续在图像编辑领域之外,再次超越 Claude 和 GPT-5 的时刻。
不过,是不是跟当时 GPT-5 一样的营销,还是真的能改变我们的使用体验,先跟我们一起来看看这些网友分享的 Gemini 3 案例吧。
起手就是写一个 Windows?
就像 nano banana 在判断生图能力时,采用的指标,是看这个模型在生成文字时的表现。
而如何判断一个基础模型的交付能力,编程,这种一旦代码里有个轻微的错误,就无法运行的项目,成了大部分基础模型厂商专攻的方向,而一开始在这方面表现不错的 Claude,也因此赚得了一定的声量。
近期多个博主在 X 上爆料,即将推出的 Gemini 3,在多个编程任务上的真实表现,不用说打败 GPT-5,甚至有直接超越 Claude 的趋势。Google AI Studio 负责人 Logan 在 X 上回复网友,确认了 Gemini 3 拥有工具调用的能力,即我们常说的智能体。
这次放出来的部分 Gemini 3 测试,完全可以说是一次测试样例的大升级。
X 博主 chetaslua 分享了多个由 Gemini 3 完成的编程任务。像是,它能直接给我们生成一个 macOS 的网页电脑,在这个网页里,就像是在操作一台云电脑。所有的应用程序都可以打开,点击 Safari 的图标,可以进入浏览器,并在网页里继续访问。
提示词: - 设计并创建一个类似 macOS 操作系统的全功能网络操作系统,从文本编辑器、带 Python 的终端和代码编辑器开始,并包含一个可玩的游戏,用于文件管理器、绘图、视频编辑器以及所有重要的 Windows 操作系统预装软件。使用任何库来完成这个任务,但确保我能够将所有内容粘贴到一个单一的 HTML 文件中,并在 Chrome 中打开它。使其有趣且高度详细,展示没有人预期的细节,在一个代码块中实现完全的创意和美感
源代码 - https://codepen.io/ChetasLua/pen/yyezLjN
https://x.com/chetaslua/status/1977866953705316571
不仅 macOS 云电脑能生成,博主还用同样的提示词,修改成 Windows、Linux、以及云手机等操作系统,开机动画、系统内操作,同样能完美还原。
当把同样的提示词交给 Claude Sonnet 4.5 处理,网友分享的结果是,Claude 只是生成了一个页面,所有的应用程序都不能点开。我也测试了一下 GPT-5 的能力,虽然它可以点开某些应用,但是打开之后,就没有下一步的处理逻辑了。
还有一个小彩蛋,在网页打开的云电脑里面,点击终端,输入 matrix,我们会看到类似黑客帝国电影海报的 01 流动代码,可以说是真矩阵革命(黑客帝国电影港版译名)了。
除了这几个热门的系统还原测试,Gemini 3 的编程能力,还体现在它的前端,也有了其他 AI 模型做不到的进步。最明显的就是 AI 编程容易出现的渐变紫,Gemini 3 终于摆脱了。
就像这个关于大语言模型的网站,输入的提示词仅仅是「为关于 LLMs 的网站编写完整的 HTML、CSS 和 JavaScript,以创建一个令人惊叹、大胆、富有创意和独特的着陆页。它应该看起来像是世界顶尖的网页设计公司从头开始构建的。」
网友们纷纷在评论区说,Gemini 3 一定有专门和设计师在合作,还有人预测 Gemini 3 将在前端领域,像 nano banana 一样占据主导地位。
不过也有人认为 Gemini 3 的前端,还是有一些问题。尽管它解决了那些讨厌的渐变,改变了大多数 AI 模型,长期以来一直在做的同样事情,但 3.0 的前端总是黑色,除非明确提示。在我看来,黑色比渐变好太多,网站的设计就是应该简洁大方。
基于能一句话搓出一个操作系统,还有优秀的前端能力,Gemini 3 还可以生成一个在线的视频编辑器,当然也是真的能够剪辑视频。
来源:https://x.com/sbalhatlani/status/1977501190322549017
CodePen 可运行的体验链接:https://codepen.io/DiNaSoR/pen/WbrEELE
一个能无限流刷视频的抖音 App 网页版。
体验地址:https://jsbin.com/yisixokuwi/1
那些做 vibe coding、一键生成网页应用工具的 Lovable、Cursor 等,可能要考虑默认模型换成 Gemini 3 了。
在经典的代码能力测试上,还有一个生成骑自行车的鹈鹕任务,比较模型对于 SVG 代码的生成效果。
Gemini 3 能生成普通的版本的鹈鹕。
甚至还有游戏《我的世界》同款风格的 3D 版本。
骑自行车的鹈鹕,现在属于是大语言模型代码能力的基准测试了。我们还看到有网友用 Gemini 3.0 Pro,生成了一个宇航员在月球打高尔夫的 SVG 动画。
生图、视觉理解,nano banana 全面版
除了编程能力,作为 Google 最强基础模型,视觉理解能力同样出色。
通过了六指测试。
能够把一个潦草的手写文档,准确提取里面的所有内容。
以及生成各种各样的城堡测试。
无聊玩玩 Gemini 3 做的小游戏
最后,让它来生成一些小游戏,小工具,部分释放出的 Gemini 3 测试案例表现都很不错。
例如可以让 Gemini 3 为我们创作原创音乐。
制作一个带有 Gemini 创作的真实配乐的游戏。
由 Gemini 3.0 Pro 制作的吸血鬼游戏。
目前这些爆料出来的 Gemini 3 测试,都是在 Google AI Studio 网页上 A/B 测试完成的。
这些网友也是不断地在 AI Studio 里面疯狂输入提示词,直到 AI Studio 给出了两个不同的回答,然后默认更好的那个就是 Gemini 3,甚至 Gemini 3.0 Pro、Ultra 等版本。
有网友说,这只是一个 A/B 测试,并不能得出结论说这个结果是由 Gemini 3.0 生成,因为也有可能只是,同一个模型,不同参数的 A/B 测试。
甚至有人发 X 说 Gemini 3 的智能体能力获得大提升,但是在帖子被广泛传播之后,他又紧急辟谣,Google 周六不上班。
不过,就在今天,Google AI Studio 首页倒是真的有了一次更新,添加了 API 数据统计等功能,很让人怀疑是不是在为 Gemini 3.0 上线做准备。
总而言之,Gemini 3 肯定是马上要来了。
OpenAI 凭借着自身拥有的庞大用户,和 ChatGPT 收集的海量数据,在最近持续性地推出了多项应用,主动推送、购物、接入 App 等等,似乎是进一步巩固用户群体,不让他们离开。
Claude 继续着他们在编程领域的老大地位,按照计划、不过分营销的推进基础模型的更新,也在他们最看重的安全方面,发布了多项研究。
作为后来居上的 Google,靠着 nano banana 属实让 Gemini 大火了一把,现在我们说到图像编辑,一定会有 nano banana,这就就跟说到编程,离不开 Claude 一样。
我甚至会觉得,Google 终于追上来了。
文章内部分视频,可访问原文链接。