关于ZAKER 合作
IT时报 03-19

AI 一键让图片动起来

即梦 AI、海螺 AI 和 Vidu 哪家强?

作者/ IT 时报记者 孙永会

编辑/ 潘少颖 孙妍

" 复活 " 这件事,似乎只在仙侠剧、科幻电影中见过,但自从有了 AI,好像变得无所不能起来。近期,有人用 AI 复原孔子、李清照等历史名人,引发热议,让人既见到了书中古人的治愈笑容,也拉近了和古人的距离。

以往,一张照片或者一幅图画虽然能够记录下瞬间的美好,但也往往缺乏一种 " 生命力 ",无法完全传达场景的活力和动感,大家更希望让一张模糊照片能变得清晰,让一张静态照片能动起来。

近日,即梦 AI 上线 " 动作模仿 " 功能,上传一张人物图片和一条参考视频,就生成一条动态视频,让图片里的人物模拟参考视频中的人物动作,连情绪都能 1:1 还原。

此次,《IT 时报》记者测试了即梦 AI、海螺 AI 和 Vidu 三款应用,看看图生视频究竟哪家强。

海螺 AI

做一名 " 创意大师 "

海螺 AI(原海螺问问)是由大模型初创公司 MiniMax 推出的一个免费 AI 智能助手,有互动式对话、声音克隆、智能创作等常用功能。

其视频讲究运动感,进入 AI 视频生成的页面后," 如何控制运镜 " 的链接提供了一个便捷的查询入口。" 点选镜头模组后,会将相关镜头词插入 Prompt 中。" 跟着格式说明,《IT 时报》记者上传了一张竹叶的静图,运镜为左移、上升的场景镜头,提示词为 " 竹叶缓缓飘动,让人感觉到风的存在 ",点击 " 生成 " 按键后,页面显示自动优化提示词,最后生成了一个时长为 6 秒的成品。

除了植物图,《IT 时报》记者还上传了一张宠物狗注视前方的图片,运镜为 " 左移,跟随 ",提示词是 " 小狗朝着看向的地方欢快地跑去 ",成品的时长同样为 6 秒。

此外,《IT 时报》记者还测试了人物图,图片中的人物主体微笑着,站在某景点外的红墙前,向镜头做起了 " 剪刀手 "。所设置的运镜为 " 推出、上升、下摇 ",提示词是 " 女生放下拍照时用的‘剪刀手’,朝镜头走来 "。

使用感受

根据竹叶飘动的画面形成的视频,海螺 AI 生成的效果整体符合《IT 时报》记者的预期,较为满意。小狗在阳光下跑动的画面同样自然,不生硬。人物体态方面,肢体动作、形态较为自然,但当人物从墙体走向镜头时,面貌发生了变化,海螺 AI 可以在人脸上继续优化。

Vidu

一款有想象力的 AI

Vidu 是生数科技联合清华大学发布的国内首个长时长、高一致性、高动态性的视频大模型,既能够模拟真实物理世界,还拥有丰富的想象力,具备多镜头生成、时空一致性高等特点。前不久,Vidu 2.0 发布,其显著特点是生成速度的提升,Vidu 非会员可以生成一段 4 秒的视频,会员可以生成一段 8 秒无水印的视频。

" 调整句式和语序,避免主体物过多或复杂;避免过度文学化的叙述。"Vidu 同样有一份详细的使用指南,有趣的是,它还具有联想能力。比如设置 " 玻璃桌上的咖啡杯,杯子外面写着单词 LOVE" 的基础词,该应用会帮助使用者构图,再提供详细的位置描述和环境描述。

《IT 时报》记者上传的素材和提示词与海螺 AI 的一样,进而对比效果,测试顺序分别是竹叶图、小狗图、人像图。

海螺 AI 和 Vidu 各有千秋,前者有镜头感,后者细节处理也不错。先看竹叶图,Vidu 的镜头同样按照提示词进行,没有进行联想,效果给人一种缓缓的 " 移动感 ",而非运动感。当《IT 时报》记者不加任何提示词时,Vidu 就开始进行了联想,在明媚的阳光下,竹叶轻轻晃动。

小狗图的体验似乎有点 " 失灵 ",视频表现出了 " 左移 " 这个提示,但几乎没有表现出跟随这一动作,而且小狗也没有跑动,在这方面,海螺 AI 生成的视频更加丰富逼真。不过,Vidu 在一些细节处理方面是亮点,比如小狗吐舌头、耳朵晃动等处理得整体让人满意。

在人像图方面,Vidu 的肢体动作也较为自然,人物面貌和本人更贴近,没有更换面孔,美中不足的是最后人物的笑容变 " 假 " 了,期待 Vidu 在人物表情、要素上更加多元。

即梦 AI

间接来一场 " 模仿秀 "

即梦 AI 上线的 " 动作模仿 " 功能,让图生视频有了新玩法。用户从 " 数字人 " 入口进入,上传一张人物图片和一条参考视频,就能生成一条动态视频。该功能支持包括肖像、半身以及全身在内的不同画幅,目前,即梦 AI 官方提供了 4 个动作模板。

进入即梦 AI 电脑端页面,《IT 时报》记者根据步骤进行了体验,由于系统强调所上传图片的角色感,所以内容须是具体的人物图。首先是对口形功能,记者上传了一张孩童正在荡秋千的图片,输入 " 妈妈,秋千真好玩 " 的台词,选择页面上提供的 " 小男孩 " 音色和标准的生成效果,最后图片变换为一段时长为 2 秒的短视频。

" 咚咚咚 ",时下,短视频平台上掀起一阵 " 李曦承进行曲 "(由韩国歌手李曦承带火的一种舞步)的模仿热潮,无论是檀健次、黄宗泽等影视演员,还是素人和网友,很多人参与了这场 " 模仿秀 "。在即梦 AI 提供的动作模仿素材中,这个舞步也是模板之一,其余还有热门表情包、贺春的素材,《IT 时报》记者上传了两张全身像,也间接感受了一把这段舞蹈。

即梦 AI 生成的视频时长最长为 30 秒,即梦提醒用户,上传的视频素材需确保拥有合法授权,平台会对视频内容进行审核,并对输出视频添加 "AI 生成 " 水印。

一定程度上,对口型功能能让人看到 2 岁左右幼童说话时的神态,但没有收获太多的惊喜,一是因为音色有点 " 出戏 ",选择性较少;二是动作略显浮夸,音色模板后续可扩展到更多适用的年龄段。

动作模仿功能可以给用户一点小惊喜,当音乐响起,图片中,记者的肢体也跟随律动起来,动感、节奏感比较强。但细看后,会发现人物形象有些失真,并不太像本人,脸部的表情也略感僵硬和机械,会有些跳戏,期待后续在人物神态的逼真度上有所提升。

排版/ 季嘉颖

图片/ 海螺 AI Vidu 即梦 AI 豆包 AI

来源/《IT 时报》公众号 vittimes

E N D

相关标签

相关阅读

最新评论

没有更多评论了