关于ZAKER 合作
量子位 3小时前

谷歌也要「AI 抖音」了!新 Veo 3.1 原生支持竖屏,4K 分辨率高画质

谷歌 Veo 3.1 又双叒升级了!

除了全方位提升视频生成质量,这一次还有两个关键词:竖屏和 4K

没错,谷歌也紧随 Sora 步伐,正式吹响了进军短视频的号角,而且还一口气把视频画质拉满了。

只需提供一张竖屏图片,外加一句简单的提示词,Veo 3.1 就能立马生成小浣熊在咖啡店打工的视频。

纪录片风格、一只浣熊经营一家咖啡店、对话。

随机上传 3 张看起来毫不相关的图片,Veo 3.1 还能施展融合大法,将它们自然组合成一个视频。

想象一下,一场时装秀上,模特们在一座完全由闪闪发光的水晶建造的大教堂里翩翩起舞。

而对于 Veo 3.1 的此次更新,按谷歌 CEO 劈柴的话来说就是:

没别的,就是想帮大家圆梦(我们听到了大家的呼声!

至于圆了哪些梦,咱这就揭晓——

移动端刷 AI 视频更爽了!

Veo 3.1 是谷歌去年 10 月发布的一个视频模型版本,这一次算是时隔 3 个月后的小幅度更新。

不过,虽然在官方眼里事小(未将这次更新列为一个新版本),但它实际上却有重大意义。

因为它清晰地宣告,谷歌这家巨头已经正式踏入 AI 短视频的竞技场。

为了满足短视频需求,升级后的 Veo 3.1 具备两大核心功能:

首次原生支持 9:16 竖屏视频,专为移动端短视频平台(如 YouTube)优化,无需裁剪。

在原有 720p 基础上,新增 4K 分辨率(此前最高为 1080p)。

下面这个视频清晰展示了画质的前后对比:

而在保证 " 外在形象 " 符合短视频模式后,Veo 3.1 也做了很多 " 内修 " 工作,将各种生成技能再往上拔高了一截。

一是提升了创意能力

和以往相比,现在即使只提供非常简单的提示词,模型也能根据参考图片和提示词生成各种小剧场。

我是一名歌剧演员。

二是一致性大幅改进。这主要包括两方面:

角色一致性:角色在不同场景中能保持高度一致的外观,便于叙述完整故事。

背景与物体一致性:能更好地保持场景和物体在多个镜头中的完整性,并可重复使用。

比如,让一位本来在街头行走的女士登上火星,虽然前后景差距很大,但人脸仍旧保持一致。

我穿着宇航服在火星上行走。

难度再高点,让人和老虎始终出现在同一个画面里,整个过程也相当自然。

一幅皇帝与他的白虎并肩而行的中景画面。

三是元素融合能力大幅改善

只需简单描述,两张照片中的角色、物体、纹理和风格化背景等,都能融合在一起形成连贯视频。

社交媒体类型的 ASMR 视频,我将通过在脸上绘制 3D 花朵并讲解整个化妆过程来进行教学。

目前上述功能已面向所有谷歌用户推出。

对普通消费者来说,可以通过 YouTube Shorts、YouTube Create 以及 Gemini 应用体验。

而对企业或专业用户来说,则可以通过 Flow、Gemini API、Vertex AI 和 Google Vids 等平台使用。

手快的网友们已经尝鲜上了,来感受一波实际效果:

虽然网友这里选了横版,但对照三张原图,肉眼可见融合效果确实不错,而且运镜很有电影感。

另一位日本网友则用它生成了虚拟偶像组合,别说还挺像样。

换成竖版,用它来制作近来很火的 AI 动漫也 OK。

Anyway,谷歌这波更新的目的已经很明确了——

通过提供竖版 AI 视频,吸引并服务更广泛的移动端用户。

而这一举动,无疑为 "AI 视频竖屏化 " 这一已见端倪的趋势,再添一把火。

AI 视频正在进入竖屏时代

让 AI 视频竖屏化,谷歌并非第一家。

远的不说,国外排在谷歌前面的就有 OpenAI 和迪士尼。

OpenAI 早在去年就推出了独立的 Sora 应用,玩法也和我们熟悉的抖音差不多,因此 Sora APP 也一度被视为 "AI 版抖音 "。

虽然这款应用一开始确实引发无数网友跟风尝鲜,但后来的一份数据显示,Sora APP 的用户留存率似乎令人堪忧——

上线之后,一路从 10%(day1)降至 2%(day7)、1%(day30)……

而在当时的分析中,原因最终被归结到了 "OpenAI 不擅长运营 " 这一点上。

因为在 OpenAI 首席研究官 Mark Chen 看来,"OpenAI 本质上仍然是一家纯 AI 研究公司 "。

对应的潜台词即为,即使打造出了 Sora APP 这样一款强大的应用,但一些后续运营对 OpenAI 来说仍是不小的挑战,何况这种短视频产品对运营的依赖更重。

而运营在谷歌这里,难度貌似就没有那么大了。毕竟谷歌最重要的王牌就是它的全栈运营能力,除了自家的 Gemini 应用,它还手握 YouTube 这样的全球热门视频平台。

这就意味着,谷歌不仅有技术,更有平台、流量和创作者生态的闭环优势

从生成工具到发布渠道,再到推荐算法和用户反馈,YouTube 本身就是一个已被验证的、成熟的视频内容运营系统。

而 Veo 的竖屏视频可以直接适配 YouTube Shorts,这不仅降低了创作者的分发门槛,更让谷歌能在用户使用数据中快速迭代模型,形成 " 创作—分发—反馈—优化 " 的正向循环。

所以对谷歌来说,让 AI 视频竖屏化归根到底只是一个时间早晚的问题,而且它还具有后发优势。

而除了谷歌和 OpenAI 这样的 AI 玩家,迪士尼也正在将竖版视频引入自家流媒体平台 Disney+。

在今年的 CES 期间,迪士尼宣布将在今年晚些时候引入类似短视频平台的竖屏内容信息流。

这一动作无疑再次印证了,视频时代竖屏模式的重要性。

而且它去年底还和 OpenAI 达成了合作,将把 OpenAI 的视频生成能力引入 Disney+,这也意味着,以后在 Disney+ 也能刷到 AI 生成的短视频了。

从这些不同领域、但各自引领行业潮流的玩家的动作来看,"AI 视频竖屏化 " 确实已经是一个渐趋明显的信号。

而且不止国外,我们国内的 AI 玩家也早就进行了相关尝试——

只需看一眼可灵 AI、Vidu AI(下图)这些国内视频生成应用,你就会找到熟悉的玩法和感觉。

真要说起来,如果将这套短视频玩法搬到 AI 领域,或许我们国内玩家更有经验呢(doge)。

参考链接:

[ 1 ] https://www.theverge.com/news/861257/google-veo-3-1-ai-video-ingredients-vertical-update

[ 2 ] https://x.com/i/trending/2011123997128155440

[ 3 ] https://blog.google/innovation-and-ai/technology/ai/veo-3-1-ingredients-to-video/

欢迎 AI 产品从业者共建

「AI 产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库,旨在成为 AI 行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。

一键关注 点亮星标

科技前沿进展每日见

相关标签