用提示词就能点对点编辑图片?
Qwen:没错,正是在下。
作为 Qwen-Image20B 的图像编辑版,Qwen-Image-Edit 除了能做上面这种精准的文字修改,还能够新增、消除、重绘、修改元素,而且还支持 IP 编辑、视角切换、风格迁移等生成式玩法。
话不多说,我们直接看效果。
原创 IP 编辑
原创 IP 编辑需要保持原始图像视觉语义不变的前提下,对图像内容进行修改,也就是所谓的语义编辑。
Qwen 以他们的吉祥物卡皮巴拉作为输入,生成了一系列衍生 IP 形象。
不难看出,这些 IP 形象既忠实呈现了卡皮巴拉的角色特性,又在对应场景中展现出丰富多彩的形象。
那么,Demo 很优秀,实测效果又如何?
对此,我们进行了简单地实测,提示词:这只熊穿着体操队服,双手拉在单杠上。
视角转换
接下来是视角转换,Qwen-Image-Edit 在这里不仅展示了 90 度旋转,还展示了 180 度旋转。
(注:这张图片并不是严格意义上的主视图,而且还有点俯视,我们看看效果。)
虚拟形象生成
虚拟形象可以说是大伙最爱玩的功能之一,生成头像嘎嘎好用。
在 Qwen 展示的案例中,如果硬要挑刺就是—— 3D 卡通风格把原先的半框眼镜变成了全框的黑框眼镜。
不过,在网友的测试中,效果倒是非常不错:自拍头像的女性版本,动漫版,007 版和恶魔版本。
除了上面的生成式语义编辑,外观元素的增、删、改也非常重要。
Qwen-Image-Edit 展示了在图片中添加指示牌的案例,可以看到 Qwen-Image-Edit 不仅成功添加了指示牌,还生成了相应的倒影,细节处理十分到位。
同时,由于照片的分辨率较高,生成的图片有些失真。
不过,基本的画面元素和新增操作还是实现了。
为了验证是否是分辨率的问题,我们把照片换成分辨率没那么高的漫画图片,输出效果还是非常不错的。
提示词:add the small wooden sign in the foreground in front of the woman with the text ‘ welcome to the sea ’(在女人前的前景中添加一个小木牌,牌上写着 " 欢迎来到大海 "。)
在消除和重绘方面,Qwen 展示了两个很巧妙的例子,一个是去除头发丝等细小元素,另一个是在一堆复杂元素中,选取其中一个元素改变颜色。
这里我们简单测试了一下改颜色的操作,把上面的 a 从黄色变成橙色。
我服了!确实厉害!
虚拟场景与穿搭模拟
接下来是两个老生常谈的电商场景,模特换背景,换衣服。
人物手部,肢体末端,头发,光影表现都不错。
Qwen-Image-Edit 在下面的案例中展示了中、英双语的文字编辑能力。
令人惊艳的是,其不光能修改海报中的大字,连细小的文字也能精准调整。
最后,就是我们开头展示的,框出错误的部分,逐步修改的方法,Qwen-Image-Edit 把它叫做链式编辑。
在 Qwen 展示的案例中,他们先用 Qwen-Image 生成了一幅《兰亭集序》。
在这里,Qwen 展示了不用重新生成整幅图片,就能解决这些问题的办法——
很简单,就是框住错误的字,交给 Qwen-Image-Edit 改就可以。
就这样,逐步修改画面中的瑕疵,最终得到完美的图片。
需要说明的是,上述简单实测均为一次出图。
可以看到,经过 Qwen-Image-Edit 处理的图片,虽然有时会有一些色调,细节的轻微改变,但在绝大多数情况下,都和官方说的一样,能达到不错的编辑效果。
你给这个效果打几分?
据介绍,Qwen-Image-Edit 这次的主要更新包括: