关于ZAKER 合作
智东西 刚刚

今天起,不用再学 PS 了:AI 自动分图层、交互生成太好用了

AI 应用风向标(公众号:ZhidxcomAI)

作者|江宇

编辑|漠影

智东西 11 月 4 日报道,近日,一款在外网刷屏的 AI 图像工具 Reve 正加紧迭代,吸引了一大批用户,其以 "Reimagine reality.(再造现实想象)" 为标语的宣传片也已获得百万播放量。

虽然目前在国内的讨论还不算多,但这款工具已经靠着 " 图层可编辑 "" 元素可交互 " 的生成方式,收获了不少好评。于是我们也上手试了试这个相对冷门但体验颇新鲜的工具—— Reve。

它不像传统 AI 生图工具那样非得靠精准提示词喂图,而是把每张图都拆成可选、可拖、可改的图层元素,你可以直接对着画面点、删、拖、改,重新组织一个你脑子里的图。

我们这次就用它复刻了最近爆火的 AI 三宫格玩法,体验下来最大的感受是:它确实有在试着帮用户绕开 " 抽卡循环 " 的难题。

打开 Reve 的官网(https://app.reve.com/),首页就是一个对话框写着 "Ask Reve",点开就能开始体验了。

往下滑还能看到一些特别有意思的示例:比如让树上长满苹果、把玻璃反光直接擦掉、或者在沙漠的岩壁上拉出一条拉链,都可以作为创作灵感。

我们随后也实际操作了一下。

在创作页面,右侧提供了两种入口方式:可以 "Start with text" 用提示词生成图,也可以 "Start with an image" 用图出发去改图;左侧还有一排风格各异的图片做参考,算是一个小灵感板。

最近 " 三宫格 "AI 图在网上挺火,我们就打算复刻一下,尤其想体验下 Reve 的交互逻辑到底和别的 AI 绘图工具有什么不同。

我们选择了 "Start with text",写了一段比较长的提示词,想生成三张海边傍晚的图,主角是威尔 · 史密斯,保持《当幸福来敲门》中的形象不变,分别是背影、中景、特写三张构图,每张图还配上中英文字幕。

为了让图尽可能贴合,我们在设置栏里手动调了图像比例(4:3)、生成数量(1)和模型质量(选了高质量)。

提交之后,系统自动跳转到了一个新的对话页面。它支持中文交流,也会根据指令自动从网上调取素材,比如它就找到了两张威尔 · 史密斯在《当幸福来敲门》里的照片做参考,然后用这两张图做了融合生成。

但这次生成只给了一张图,而且只是我们提示词里的第一张(背影)。它并不能真的一口气画出三宫格,也没有按我们指令里的内容生成中文字幕。虽然能读懂中文,但感觉模型本身对中文提示的渲染能力还比较弱。

所以我们转向编辑这张图,看看能不能改动一下。图片上方的功能栏很丰富,可以收藏、下载、删除、改名,也有 " 编辑 " 按钮。

我们点了编辑,就进入了一个图像分层的界面。系统自动识别了图里的多个主体:人物、海滩、天空、字幕,甚至连它从网上搜来的两张原始图也能一起编辑。

首先看着乱码的中文字幕实在太奇怪了,于是我们尝试删掉字幕部分。

点击 " 字幕 " 这个图层,会弹出 " 编辑 " 和 " 删除 " 两个按钮,选编辑后,系统直接把它理解的原始指令贴了出来,比如 "Subtitles: ‘山的后面是什么?-What ’ s beyond the mountain? ’ in a clean, white font at the bottom center of the frame"。

我们把中文删掉,再确认修改。这时候图像左上角会标一个蓝色小圆点,提示这个元素已经变动。

接着我又尝试把人物朝向调一下。原本是背影,我希望换成正脸面对镜头的视角,于是改了提示词:" 威尔史密斯正脸面对镜头,手持一束花束,侧身站立于海边 ……" 修改后,系统自动把它翻译成英文并重新理解,背景里的 " 沙滩 " 元素也跟着变了。

再点 "Apply Edits" 应用更改之后,图像确实发生了显著变化,这次已经很接近我们设想中的画面。

调通一张图后,我们继续拆分原提示词,用同样方法单独生成三张图,组成一个 " 三宫格 "。最后一张大特写的人脸一致性很准确,基本没有什么 AI 感。

那体验完单一主体图之后,我们又试了下 " 多主体 + 参考图 " 的能力,毕竟参考图复现和多元素编辑才是 Reve 的看家本领。

我们上传了一张肯德基吉祥物 " 奇奇 " 的照片,提示词写的是:主题是一只鸡在海边散步,鸡的形象依据参考图保持不变。白天,海边,鸡背对镜头看向远处的大海,画面安静,字幕写在底部:"-What ’ s beyond the sea?-"。整体色调清冷,带有富士胶片效果,过度曝光,画面粗粝且色调偏冷,暗部细节保留完整,高光区域呈现自然化、柔和漫射光,无明显硬边阴影。

这个图的生成结果还挺符合设定的,特别是细节,比如画面里没有硬阴影,字幕位置也基本对。

有意思的是,之后我们又输入了两个图像提示,但没有再上传参考图,Reve 居然还是能延续我们上传的 " 奇奇 " 形象进行生成,说明它的上下文保持能力还不错,不是每条提示都要重设角色。

我们还试着把生成好的图编辑了一下。这个阶段的操作非常直观,Reve 会把每张图里的主体识别出来,用户可以像 PPT 一样拖拽位置改布局。

我们随便调了几个汉堡和薯条的位置,再次生成后,它们就出现在我们想让它们出现的地方。

最后我们本想把以上两组三宫格图拼成一段视频,但这一步卡住了:Reve 的视频生成功能虽然接入了 Veo 3.1 模型,但需要 Pro 会员才能使用,而且仅限美国和加拿大地区开放。

写在最后:Reve 使用起来究竟怎么样?

回过头来想这次体验,有个印象挺深的点。我们一直以来都在为 " 写不出好提示词 " 发愁,不管网上有多少模版,最后能不能生成你想要的图还是个玄学。

而 Reve 的 AI 图像编辑思路是:不强求你写得完美,它把提示词拆成了图像的每个元素——你只需要点一下、拖一下、改一句话,它就知道你要什么了。这种 " 拖拽式交互 " 的体验感,比用户在黑盒里反复试错要来得轻松很多。

体验过程中,我们还注意到一些细节:比如上传参考图后,Reve 能在后续对话中保持住角色形象,说明它的上下文记忆也包括参考图。在图层编辑时,我们拖动汉堡、薯条的位置后重新生成,Reve 并没有 " 胡乱摆放 ",而是能理解这些物品应当落在桌面上的常识,整体画面符合现实逻辑,没有出现飞在空中或错位的离谱结果。

某种程度上,它更像是一个 AI 版 Photoshop。只是你不再需要自己拉图层、打蒙版、调不透明度,而是通过自然语言和图形交互就能完成 " 即改,即生成 " 的精修流程。

更有意思的是,这款体验成熟度很高的产品,背后其实只是一个 10 人初创团队做的。创始人 Michaël Gharbi 曾在 Adobe Research 任职,今年 3 月刚推出 1.0 版本,到 10 月就已经走到了图像结构可编辑的阶段。

从功能体验这一块往前卷,我觉得这也许就是 AI 创作类工具在 " 后基础模型阶段 " 的一条出路。

如果你也用 Reve"P 过图 ",或者玩过其他 AI 模型生成的三宫格,不妨在评论区晒晒你最满意的一张。