文 | 尚恩
编辑 | 邓咏仪
OpenAI 悄咪咪的又在半夜整活,这次直接把 AI 绘画和 ChatGPT 合并了!
来源:OpenAI
美国时间 9 月 21 日凌晨,OpenAI 官宣文生图 AI 工具 DALL · E 系列迎来最新版本DALL · E 3。相比上一代模型 DALL · E 2,DALL · E 3 自身的画技不仅提升巨大,还能准确理解语意、细节的细微描述差异。
还记得去年 DALL · E 2 发布时,带动了一波 AI 文生图模型热,包括 Stable Diffusion 在内的众多与 AI 生图有关的工具、模型都是在当时推出的。
更重要的是,这次 OpenAI 直接把DALL · E 3 和 ChatGPT集成到了一起。
简单说就是,新版 DALL · E 3,直接省去了提示词工程(Prompt Engineering)这一步,你只管随意发挥想象,词由 ChatGPT 帮你拓展,画画就交给 AI 来搞,So Easy。
来源:公开网络
对此,OpenAI 联合创始人 Greg Brockman 直接表示:
很难不爱。
来源:X(原 Twitter)
这般操作,也属实是把网友看的一愣一愣的。不少网友都惊呼,这也太绝了!
也有网友在看过 DALL · E 3 生成的图后,直接表示:"Midjourney 拜拜了您内 "。
在 ChatGPT 里就能玩
要说这次 DALL · E 3 发布中,最大的亮点,当属是把AI 绘图原生构建在 ChatGPT 之上。
为啥这么说?对比以前的文生图工具,都是先将文本 Prompt 转换成图像,即使是 DALL · E 2,也会经常忽略特定的措辞导致出错。现在只需向 ChatGPT 提出要求,一个简单的句子,AI 就能开启头脑风暴改进提示,再也不用为写不出华丽的提示词而头疼
甚至,你还可以在对话过程中,基于生成的图像随时做出修改。
比如官方给出的这个例子,详细的展示了 DALL · E 3 是如何详尽地将提示词中的每一个场景,生成如下一幅佳作。
一轮满月下洒满街道,熙熙攘攘的行人正享受着夜生活。街角摊位上,一位有着火红秀发,身着典雅天鹅绒斗篷的少女,正与脾气暴躁的老板讨价还价。
除此以外,OpenAI 也表示:"DALL · E 3 比以往系统更能理解细微差别和细节,让用户更加轻松地将自己的想法转化为非常准确的图像。"
比如,下面这两幅图分别是由 DALL · E 3 与 DALL · E 2 生成,同样的一段 Prompt「一幅描绘篮球运动员扣篮的油画,并伴以爆炸的星云」,左图 DALL · E 2 在细节、清晰度、明亮度等方面显然逊于右图 DALL · E 3 的。
左:DALL · E 2;右:DALL · E 3
DALL · E 3+ChatGPT 配置到底有多绝?这不,OpenAI 官方就专门给 DALL · E 3 搞了一个超可爱的宣传视频,连 CEO Sam Altman 都忍不住称赞。
根据放出的视频,可以看到用户写了一段提示词「我家 5 岁宝宝一直在说一个超级向日葵刺猬,它该长什么样?」,ChatGPT 同时写了四段不同风格的提示词,直接生成四张风格迥异的图。
接下来选择最后一张图,给小刺猬起个名字,就叫小 Larry 吧,并为它画一个房子。
另外,DALL · E 3 还可以根据图片的风格,生成可爱的贴纸。
最后,让 ChatGPT 总结一下刚才的内容,生成一个睡前故事。咱就是好家伙,这配合着 ChatGPT 配件玩,完全可以生成一个电子书了。
目前 DALL · E 3 还未完全开放,想玩还得等一等,不过可以先来看看 OpenAI 放出的大量样图,官方也很贴心的给每张图都附上了对应的提示词。
提示词:一个装饰着室内植物的咖啡馆的小地图立体模型,顶部是木质横梁纵横交错,里面有一个冷饮站,上面有小瓶子和玻璃杯。
提示词:一种带有大玻璃窗的现代建筑物,坐落在悬崖上,在日落时可以俯瞰宁静的海洋。
而 CEO Altman 最喜欢的则是这张 " 牛油果看医生 "。
有网友去试把同样的提示词用在 DALL · E 2 上的效果,嗯… . 咱就是说,咋看咋别扭。
这么一对比,可以发现 DALL · E 3 确实进步了不少。
下面简单梳理了一下 DALL 系列。
DALL · E 引发 AI 绘图热,Midjourney 捏把汗
2021 年 1 月 6 日,OpenAI 在其博客发布了两个文本图像的神经网络 **DALL · E 和 CLIP。DALL · E 可以基于文本直接生成图像,CLIP 则能够完成图像与文本类别的匹配。
2022 年 4 月,DALL · E 迎来升级版本 -DALL · E 2。与一代相比,DALL · E 2 在生成用户描述的图像时具有更高的分辨率和更低的延迟。并且,二代还增添了一些新的功能,比如对原始图像进行编辑。
目前,DALL · E 3 处于研究预览版本,根据 OpenAI 计划,将于 10 月份首先向 ChatGPT Plus 和 ChatGPT Enterprise 用户发布,独立版在今年秋天晚些时候提供。
随着 OpenAI 推出 DALL · E 3,AI 绘画领域只能说是太卷了,其中最大的玩家莫过于估值 10 亿美元的文生图 " 扛把子 "Midjourney 了。
很多网友们也手痒搞事,用同一个提示词在 DALL · E 3 和 Midjourney 生成,然后放出来进行比较。
来源:OpenAI、Midjourney
对比看下来,你觉得哪个效果更好呢?
One More Thing
AI 生图虽然好玩,但争议也不少,今年初 Stability AI 和 Midjourney 就遭到三位艺术家的版权诉讼。
这一次,在版权问题、生图安全这块,OpenAI 也是专门下了点功夫。
来源:Artist and Creative Content Owner Opt Out
首先,OpenAI 在 DALL · E 3 上进行了大量工作,包括强化安全措施,以防止生成暴力、色情的图像,或是带有公众人物姓名的图。
另外,为了确保模型的安全性,团队还使用了输入分类器,可以帮助识别图像是否由 DALL · E 3 生成
此外,OpenAI 还允许创作者填写表格,禁止网络爬虫访问艺术家自己的网站。也可以直接发送想要保护隐私的图像,团队就会将其从训练数据中删掉。
长按添加「智涌」小助手入群
添加请备注:公司 + 职务
来源:公众号【智能涌现】