微软将 Sora 免费了,但却已经晚了。
前天,微软 Bing 宣布在其应用程序中推出 Bing 视频创作器(Bing Video Creator),该功能基于 OpenAI 的 Sora 模型,允许用户通过文本提示词生成视频。这也是 Sora 首次面向用户免费开放。
就在昨天,Manus 推出原生文生视频,嵌入进了自家 Agent 的工作流中。
一个是默默关注 Sora、OpenAI 背后的 " 大东家 ",另一个则是 AI Agent 里的 " 新秀 ",两方在自家产品生态中上马文生视频的时间点几乎是一样的。可见,微软这一步棋到底慢了多久。
为什么说它是 Sora 的副产品?因为微软上线的 Bing 视频创作器从产品力和宣传上来讲,很难说得上是个完整的产品。
当微软终于宣布将它免费向用户开放时,这个消息并未掀起预期中的热潮,反而透着一股尴尬的迟到感。网友对这款产品的 " 自来水 " 评价很差,甚至直言:我们已经有了可灵和 Veo,为何还用 Sora?
下面让我们来看看,在微软与 OpenAI 的复杂博弈中上线的 Bing 视频创作器,到底体验如何?
一、微软的 Sora,这回表现如何?
当 OpenAI 首次官宣 Sora 时,"Sora 的诞生是牛顿时刻 " 的说法迅速刷屏网络,甚至激发了诸多科技大厂的产品灵感与探索方向。当时的 OpenAI 用实际宣发告诉所有人:AI 得这么玩。
尽管如今文本生成视频已经成了 " 烂大街 " 的常规功能,但在当时几乎只有 Sora 成功出圈了。
不过,免费归免费,微软的 Bing 视频生成器目前仍存在明显局限:视频长度仅限 5 秒,画面比例只有 9:16 可选,且同时最多只能排队生成三个视频。更尴尬的是,其生成速度也颇为感人,Fast 模式尚需几分钟,Standard 模式甚至要耗费数小时,难免让人怀疑微软究竟获得了 OpenAI 多少的资源支持。
没错,这个 " 产品 " 只有下面这 4 个可选项:
(1)羊驼穿西装在冰上跳舞
提示词:
一只羊驼穿着蓝色的西装,像人一样双腿直立,在中央公园的冰面上跳着动感舞曲
An alpaca wearing a blue suit and standing upright on its legs like a human being, dances a dynamic dance on the ice in Central Park
Bing 视频生成器:
画面主体羊驼辨识度低,背景 AI 感强烈,动作虽流畅,但整体质感回到了一年前。如果我不提谁能看得出来这是只羊驼?
紧接着,我同样用 OpenAI 的 Sora 试了下一模一样的提示词。画面的视觉效果明显上了一个层次,无论是颜色的层次感、画面主体的动作流畅度,甚至是冰面的阴影的显示都很真实。
接下来就是可灵 2.1 大师版了。虽然用最新出的模型去对比 Sora 有点欺负人,但是 2.1 的普通模式无法文生图,也就只能出出血,拿大师版试一下了。
可以看得出来,运镜设计创意比较好,画面连贯且风格统一,动作复杂性和自然程度也很高。
相比之下,即梦的效果就比较抽象了。风格略显割裂,背景像是绿幕效果,动作重复且表情僵硬,整体表现不佳。我很怀疑是否是我的提示词给错了。
谷歌的 Veo3 效果依旧耐打,视频整体视觉效果流畅,画面连贯性比较好。色彩正常偏明亮,动作和表情也比较自然不僵硬。但是没有运镜,镜头语言比较单一。Veo 3 的真实感和流畅度确实都很好。
一个空的玻璃茶杯内有旋转的彩色光芒,杯身放置在木桌上,木桌上映出茶杯明亮的倒影。镜头缓缓向茶杯靠近。
An empty glass teacup with a swirling colored glow inside is placed on a wooden table, which reflects the bright reflection of the teacup. The camera slowly moves closer to the teacup.
茶杯这个例子是我从 Bing 视频生成器的官方推荐灵感库里找到的,效果只能说勉强贴合提示词,但色彩生硬,整体视觉感受奇怪。
我还放了几个官方 Case,大家可以自行评判效果:
如今,围绕 AI 下半场的讨论热火朝天,但无论争论的焦点如何变化,"AI 下半场比拼的是产品能力 " 已经成为行业共识。然而,OpenAI 旗下的 Sora 产品因价格高昂和发布延期,几乎已从主流 "AI 视频工具 " 的竞赛中 Out 了。
从 2024 年初开始,现象级别的 Sora 带给所有关注者的不是惊喜,而是不断的懵圈:不断延期的同时,每隔一段时间就释放一些新的令人惊艳的 " 小道消息 ",展示自身的强大能力。终于,在年末时,Sora 终于发布了,奥特曼甚至称它为 " 视频版的 GPT-1"。
媒体 VentureBeat 在一篇评论中直言:"Sora 上市时万众瞩目,但不到一年,其光环已经大幅褪色。"Sora 的发布频繁跳票,错过了 AI 视频产品的黄金发展期,其背后离不开大东家微软与 OpenAI 之间错综复杂的博弈。
微软与 OpenAI 在 AI 领域的合作关系,从一开始发展得非常要好到 " 心生嫌隙 ",几乎贯穿了这款产品的研发周期。从 2023 年下半年开始,自 OpenAI 推出自有企业版产品之后,微软就不再 " 完全相信 "OpenAI 了。
在那场围绕 OpenAI CEO 奥特曼的宫斗风波中,微软深度介入协调,但双方管理层之间仍旧出现了很多矛盾:员工之间互相不爽,OpenAI 团队依靠自有技术高人一等,微软团队也对分享前沿技术持保守态度。这个时候,微软内部就已经有呼声希望尽快将 Sora 整合进产品线了。
在 2024 年,微软招揽 Mustafa Suleyman 负责自家 AI 业务,更加明确了 " 摆脱对 OpenAI 依赖 " 的意图。Salesforce CEO Marc Benioff 更是爆料称,奥特曼与 Mustafa Suleyman 的关系不睦。
此外,Sora 自身在安全性上的问题迟迟未能有效解决。YouTube 曾公开指责 Sora 侵犯其数据版权。虽然一番风波中,有枪打出头鸟的嫌疑,但是自从 Sora 代号公布以来,麻烦确实不断。总结成一句话:微软想用 Sora 当王牌拯救产品线,OpenAI 则碍于一系列考虑不断推迟。
微软这回围绕免费版 "Sora" 推出的一系列市场推广动作,却让用户好感度骤降。比如,微软选择在 Bing 平台上线 Sora 而非旗舰 AI 平台 Copilot,这是否是微软游移不定的最佳证明?再有,Bing 上利用 Sora 视频生成时还需要赚积分操作,生硬的推广也让大家 " 愣神一秒 "。
与此同时,市场上涌现了如 Kling、Vidu AI、即梦、PixVerse、WanX、谷歌 Veo、Luma 和 Runway 等一大批优秀的 AI 视频生成工具。Kling 早在 2.0 版本时便宣称在物理引擎和叙事连贯性上超过了 Sora;谷歌的 Veo 系列甚至支持了高品质 AI 配乐和音效。
反观 Sora,承诺的单次 60 秒视频生成至今未完全兑现,用户实际最多只能体验 20 秒的输出效果。可以说,如今的 Sora 虽然免费,但在技术表现和用户体验方面已很难与竞品保持竞争力。更何况,这一年中,中国厂商纷纷将成本压到什么等级,所有用户有目共睹 。
可以说,微软这回搞的免费版 Sora,真的有点晚了。
三、中国厂商后来者居上,优势能保持多久?
Sora 刚问世时,曾给国内 AI 视频行业带来了巨大压力。如今,尽管微软将 Sora 免费开放,但在文本生成视频领域,黄金窗口期似乎已被错过。不过,微软毕竟是微软,庞大的 Windows 和 Office 用户生态,加上必应这一强大的入口渠道,能迅速放大 Sora 的影响力,触达到数量巨大的普通消费者。
过去的一段时间中,中国的 Kling、Vidu AI、即梦、PixVerse、WanX 等一众产品已经经过了无数次的迭代,其中像是 Kling 等产品都已经成功跑通商业化。
Sora 就像达摩克利斯之剑,一直悬在国内外众厂商的头顶上。没人知道,Sora 的到来,是否会瞬间变革一切。Sora 本身的性能可以说仍在第一梯队,其流畅性一直被人津津乐道。这回有了微软这家 " 横跨 PC 时代,移动互联时代,云计算时代,并且在每一个时代都引领潮头的超级巨厂 " 在产品端的下场,Sora 得到的助力将会远超以往。
" 已经晚了 " 并不意味着没有机会了。
可以预计,微软开放 Sora 将迫使竞争对手们加速创新,推出更优服务。国内 AI 视频厂商想必都感受到了一些冲击。之前,他们通过快速迭代,从而在 AI 视频效果的各个领域积累起来的优势,俨然无法让大家继续安心前行。
AI 视频生成领域可以说是一个 " 强技术、高变动 " 的赛道,这条路有多难走,国内大厂有话说。比如,百度 CEO 李彦宏就曾在 2024 年第三季度内部会上明确表示:" 百度不碰 Sora 类的视频生成。" 他认为 To B 业务应尽量避免那种 " 吃力不讨好 " 的定制项目,而应推出标准化产品。
阿里巴巴通义团队的 AI 视频生成模型 WanX2.1 的开源策略,也走出了一条独特的道路,在开源的领域蚕食关注力。
Sora 会跑的多快?我们无法预测,但是中国厂商仍需提速。过去一年,谷歌 Veo2、Veo3 在性能上的领先幅度非常大,但高昂的成本令市场反应平淡;反而是价格适中、性能更均衡的 Kling 等产品大受欢迎,迅速积累了 2200 万用户。
" 免费 " 策略对用户的心理冲击是巨大的。尽管微软的免费行动更像是被动追赶,而非主动创新,但在巨头资源的加持下,Sora 仍可能引发新一轮行业竞争。
Sora 能否凭借免费重回巅峰?国产厂商们还能保持多久的领先优势?或许答案并不遥远。毕竟在 AI 时代," 谁跑得更快 " 比 " 谁先起跑 " 更为关键,先行者需要不断提速,追赶者则希望弯道超车。
本文来自微信公众号:直面 AI,作者:涯角,编辑:肖阳