APP下载

关于ZAKER

合作

IT时报 03-19

AI 一键让图片动起来

即梦 AI、海螺 AI 和 Vidu 哪家强？

作者／ IT 时报记者 孙永会

编辑／潘少颖孙妍

" 复活 " 这件事，似乎只在仙侠剧、科幻电影中见过，但自从有了 AI，好像变得无所不能起来。近期，有人用 AI 复原孔子、李清照等历史名人，引发热议，让人既见到了书中古人的治愈笑容，也拉近了和古人的距离。

以往，一张照片或者一幅图画虽然能够记录下瞬间的美好，但也往往缺乏一种 " 生命力 "，无法完全传达场景的活力和动感，大家更希望让一张模糊照片能变得清晰，让一张静态照片能动起来。

近日，即梦 AI 上线 " 动作模仿 " 功能，上传一张人物图片和一条参考视频，就生成一条动态视频，让图片里的人物模拟参考视频中的人物动作，连情绪都能 1:1 还原。

此次，《IT 时报》记者测试了即梦 AI、海螺 AI 和 Vidu 三款应用，看看图生视频究竟哪家强。

海螺 AI

做一名 " 创意大师 "

海螺 AI（原海螺问问）是由大模型初创公司 MiniMax 推出的一个免费 AI 智能助手，有互动式对话、声音克隆、智能创作等常用功能。

其视频讲究运动感，进入 AI 视频生成的页面后，" 如何控制运镜 " 的链接提供了一个便捷的查询入口。" 点选镜头模组后，会将相关镜头词插入 Prompt 中。" 跟着格式说明，《IT 时报》记者上传了一张竹叶的静图，运镜为左移、上升的场景镜头，提示词为 " 竹叶缓缓飘动，让人感觉到风的存在 "，点击 " 生成 " 按键后，页面显示自动优化提示词，最后生成了一个时长为 6 秒的成品。

除了植物图，《IT 时报》记者还上传了一张宠物狗注视前方的图片，运镜为 " 左移，跟随 "，提示词是 " 小狗朝着看向的地方欢快地跑去 "，成品的时长同样为 6 秒。

此外，《IT 时报》记者还测试了人物图，图片中的人物主体微笑着，站在某景点外的红墙前，向镜头做起了 " 剪刀手 "。所设置的运镜为 " 推出、上升、下摇 "，提示词是 " 女生放下拍照时用的‘剪刀手’，朝镜头走来 "。

使用感受

根据竹叶飘动的画面形成的视频，海螺 AI 生成的效果整体符合《IT 时报》记者的预期，较为满意。小狗在阳光下跑动的画面同样自然，不生硬。人物体态方面，肢体动作、形态较为自然，但当人物从墙体走向镜头时，面貌发生了变化，海螺 AI 可以在人脸上继续优化。

Vidu

一款有想象力的 AI

Vidu 是生数科技联合清华大学发布的国内首个长时长、高一致性、高动态性的视频大模型，既能够模拟真实物理世界，还拥有丰富的想象力，具备多镜头生成、时空一致性高等特点。前不久，Vidu 2.0 发布，其显著特点是生成速度的提升，Vidu 非会员可以生成一段 4 秒的视频，会员可以生成一段 8 秒无水印的视频。

" 调整句式和语序，避免主体物过多或复杂；避免过度文学化的叙述。"Vidu 同样有一份详细的使用指南，有趣的是，它还具有联想能力。比如设置 " 玻璃桌上的咖啡杯，杯子外面写着单词 LOVE" 的基础词，该应用会帮助使用者构图，再提供详细的位置描述和环境描述。

《IT 时报》记者上传的素材和提示词与海螺 AI 的一样，进而对比效果，测试顺序分别是竹叶图、小狗图、人像图。

海螺 AI 和 Vidu 各有千秋，前者有镜头感，后者细节处理也不错。先看竹叶图，Vidu 的镜头同样按照提示词进行，没有进行联想，效果给人一种缓缓的 " 移动感 "，而非运动感。当《IT 时报》记者不加任何提示词时，Vidu 就开始进行了联想，在明媚的阳光下，竹叶轻轻晃动。

小狗图的体验似乎有点 " 失灵 "，视频表现出了 " 左移 " 这个提示，但几乎没有表现出跟随这一动作，而且小狗也没有跑动，在这方面，海螺 AI 生成的视频更加丰富逼真。不过，Vidu 在一些细节处理方面是亮点，比如小狗吐舌头、耳朵晃动等处理得整体让人满意。

在人像图方面，Vidu 的肢体动作也较为自然，人物面貌和本人更贴近，没有更换面孔，美中不足的是最后人物的笑容变 " 假 " 了，期待 Vidu 在人物表情、要素上更加多元。

即梦 AI

间接来一场 " 模仿秀 "

即梦 AI 上线的 " 动作模仿 " 功能，让图生视频有了新玩法。用户从 " 数字人 " 入口进入，上传一张人物图片和一条参考视频，就能生成一条动态视频。该功能支持包括肖像、半身以及全身在内的不同画幅，目前，即梦 AI 官方提供了 4 个动作模板。

进入即梦 AI 电脑端页面，《IT 时报》记者根据步骤进行了体验，由于系统强调所上传图片的角色感，所以内容须是具体的人物图。首先是对口形功能，记者上传了一张孩童正在荡秋千的图片，输入 " 妈妈，秋千真好玩 " 的台词，选择页面上提供的 " 小男孩 " 音色和标准的生成效果，最后图片变换为一段时长为 2 秒的短视频。

" 咚咚咚 "，时下，短视频平台上掀起一阵 " 李曦承进行曲 "（由韩国歌手李曦承带火的一种舞步）的模仿热潮，无论是檀健次、黄宗泽等影视演员，还是素人和网友，很多人参与了这场 " 模仿秀 "。在即梦 AI 提供的动作模仿素材中，这个舞步也是模板之一，其余还有热门表情包、贺春的素材，《IT 时报》记者上传了两张全身像，也间接感受了一把这段舞蹈。

即梦 AI 生成的视频时长最长为 30 秒，即梦提醒用户，上传的视频素材需确保拥有合法授权，平台会对视频内容进行审核，并对输出视频添加 "AI 生成 " 水印。

一定程度上，对口型功能能让人看到 2 岁左右幼童说话时的神态，但没有收获太多的惊喜，一是因为音色有点 " 出戏 "，选择性较少；二是动作略显浮夸，音色模板后续可扩展到更多适用的年龄段。

动作模仿功能可以给用户一点小惊喜，当音乐响起，图片中，记者的肢体也跟随律动起来，动感、节奏感比较强。但细看后，会发现人物形象有些失真，并不太像本人，脸部的表情也略感僵硬和机械，会有些跳戏，期待后续在人物神态的逼真度上有所提升。

排版／季嘉颖

图片／海螺 AI Vidu 即梦 AI 豆包 AI

来源／《IT 时报》公众号 vittimes

E N D

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频剪辑

AI视频剪辑

AI智能客服

AI工具箱

AI写稿助手

AI口语陪练

我的订阅

AI 一键让图片动起来

宙世代

一起剪

相关阅读

马斯克对全球宅男下手了！和AI女友谈恋爱，每月“只”收30美元

黄仁勋大赞中国AI模型：世界一流、是全球进步催化剂

苹果留了一手！iPhone 17 Air 12GB内存速度不及Pro版

微软“AI裁员风”刮到了印度

小鹏汽车扩招8000人！年内员工规模将达3万人

曾经爆火的“机器人警察”停产？众擎机器人联创姚淇元：不实信息

人形机器人六维力传感器市占率70%以上，为智元、小米供货，「蓝点触控」完成近亿元B轮融资

整体性能提升30%的国产AI数据库一体机发布，人大教授：中国数据库发展没有捷径

英伟达H20重回市场，但中国芯片过去三个月已爆单

斥资25亿元！韩国计划发展iLED显示技术：使用寿命、亮度优势显著

史上最大规模的无人驾驶合作！数千辆萝卜快跑无人车将上线Uber接单

AI广告48小时破亿播放，传统广告人如何求生？

首款折叠屏 iPhone 成本曝光/罗马仕回应谣言：售后持续运转/京东再入新局：开启医美行业

小米手机全球销量最高系列！REDMI 15C入网：百元良心神机

换上唐装，黄仁勋最新发声

最新评论

IT时报

热门推荐