关于ZAKER 合作
三易生活 17小时前

谷歌发布新一代文生图模型,每图收费 0.04 美元起

继此前在 2025 I/O 开发者大会上发布新一代文生图模型 Imagen 4 系列后,日前谷歌方面宣布,该系列模型已上线 Gemini API 付费预览版,同时用户可通过 Google AI Studio 进行有限免费测试。

据了解,与 Imagen 3 相比,Imagen 4 系列支持 2K 分辨率的图像生成,并在细节捕捉上实现显著提升。此外 Imagen 4 系列在文本渲染方面取得突破,能够在图像中生成清晰、准确的文字,这也意味着其适用于需要嵌入自定义排版的设计场景,例如广告、漫画或邀请函等。

目前,Imagen 4 系列包括 Imagen 4、Imagen 4 Ultra 两个模型。其中 Imagen 4 定位为 " 适用于大多数任务 " 的通用模型,定价为每张图像 0.04 美元,而 Imagen 4 Ultra 则能够更精准地遵循文本提示词,定价为每张图像 0.06 美元。谷歌方面表示,与 Dall-E 和 Midjourney 等其他图像生成模型相比,Imagen 4 Ultra 的输出结果更为 " 出色(strong)"。

但需要注意的是,为了维护信任和透明度,Imagen 4 模型生成的所有图像将继续包含不可见的数字 SynthID 水印。

值得一提的是,日前谷歌方面还发布了首个可以直接部署在机器人上的视觉 - 语言 - 动作(VLA)模型 Gemini Robotics On-Device。据了解,作为 Gemini Robotics 系列的新成员,Gemini Robotics On-Device 可以帮助机器人更快、更高效地适应新任务和环境,同时无需持续的互联网连接。

面向开发者,谷歌方面还将发布 Gemini Robotics SDK,用于评估 Gemini Robotics On-Device 在其任务和环境中的表现。同时,开发者还可使用该 SDK 在谷歌 DeepMind 的 MuJoCo 物理模拟器中测试该模型,并快速将其适应到新领域。

【本文图片来自网络】

相关阅读

最新评论

没有更多评论了