我承认 Anthropic 和 Google 都很强,但是今天,OpenAI 要更胜一筹。
一夜之间,AI 做图以假乱真的能力,可能要提高 1000 倍了。
让乔布斯代言小米 SU7,海报它能直接安排上。



底下还自动拉来了王自如的评论。


毫不夸张地说,AI 做图的能力,从来没有如此强过。
在大模型竞技场里,当大家的平均分都在 1200 分左右厮杀的时候。
GPT-image-2 直接给干到了 1500 分,遥遥领先其他模型。

可能是 Sora 被关闭了之后,OpenAI 的算力变的更多了。
所以山姆奥特曼也是大放善心,现在不管你是免费用户还是付费用户,都可以在 ChatGPT 的官网里直接用上。
就连 API 也是直接开放,不但量大管饱,而且价格还只要 Nano Banana Pro 的 1/4。
我们也帮大家简单的试了一下。
只要你上传一张参考图片,它就可以精准还原你的形象。
有了它,你可以随意穿越到任何游戏里。

生成这个角色和原神里的旅行者(女)绝区零里的铃,崩坏星穹铁道里的星 这三个角色的合影,背景是无垠的宇宙

比如原神和塞尔达的联名海报。



即使你问到了它不懂的东西,GPT-image-2 也会直接开始进入思考,现查现学。

经常上学的网友也可以验算看看,看看答案对不对。

让它做个西湖醋鱼的制作流程也能一次完成,效果要比 Nano Banana Pro 不知道要高到哪里去了
帮我制作西湖醋鱼这道菜的详细制作流程图 , 真实风格 , 适用于小红书图文比例(右边是 Gemini 做的。

你不用费太多力气写一大堆提示词,他就能给你出一张 90 分的图片。
像是下面这种红白机的宣传海报。
生成一张苹果风格的任天堂红白机宣传海报


你还能发现,在生成抖音截图里,AI 观众还会在弹幕里实时交流,给咱们开演一波小剧场。

过去你想让 AI 做一张抖音截图,你可能得告诉它这张图的最上面是什么,最右边得放什么,下面放什么。
整个画面必须像真实手机截图,而不是设计图。需要完整呈现短视频直播 UI 叠层:
顶部有状态栏,显示时间、电量、信号、Wi-Fi;
左上角有主播头像、用户名、直播中标识、实时在线人数;
右侧有一排直播交互按钮,比如点赞、评论、分享、礼物、关注;
底部有半透明评论区,观众弹幕不断刷过,内容是中文,口语化、简短、像真实直播弹幕;
右下角有礼物特效入口、购物袋入口或者更多功能按钮;
底部输入栏有 " 说点什么 ..." 之类的互动区域;
直播界面中有平台风格的红色或高亮直播标识;
整体布局必须符合真实中国直播平台的移动端视觉习惯。
给 AI 写一大堆提示词。
但现在,只要简单说一句话,AI 就会自动搞懂你的意思。
搞不懂的地方,它还会自己去查。
和年初的 Seedance 2.0 一样,用好 AI 的门槛再一次被狠狠的打下来了。
有图有真相的时代,算是彻底的和我们切割了。
新模型做出来的很多图像,不但能够轻松骗过我们的眼睛。
就连专门的 AI 图像检测助手也是直接睁眼瞎了。




最让我绷不住的是,我们在一些图片右下角。

不知道是不是蒸馏过 nano banana 的数据。或者说网上的图片数据,已经被 nano banana 给污染霍霍完了。
导致新模型被这些有毒数据污染了。。

如果我们直接让他来生成一幅书法真迹,你会发现它做的好像还挺有模有样的。
生成《兰亭序》真迹放在桌面上的图片


也期待友商或者下个版本,能彻底堵上这些 Bug 吧。
AI 圈真的像是有一种轮回,先是 OpenAI 一骑绝尘,之后谷歌逆袭,再来个 Anthropic 砸场。还有个随时可能掀桌的 DeepSeek。
而现在,我们的位置,又来到了这里。

已经不敢想,明年的这个时候,AI 会进化成啥样了。
撰文:早起 & 江江
编辑:江江 & 面线
美编:素描


