APP下载

关于ZAKER

合作

量子位昨天

阿里开源 14B 电影级视频模型！实测来了：免费可玩，单次生成时长可达分钟级

AI 视频生成正在迎来 " 通义时刻 "！

就在昨夜，阿里突然发布了一款由音频驱动的 14B 视频模型Wan2.2-S2V——

仅需一张图片和一段音频，即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。

玩法 + 效果 be like：

△来自 @AIMIRAI46487

而且最重要的是，新模型发布即开源，现在人人都能在通义万相官网免费体验。

根据官方介绍，Wan2.2-S2V 最大亮点在于：

单次生成时长可达分钟级，且具有稳定性和一致性；

影院级音频生成视频能力；

基于指令的高级动作与环境控制。

尤其在生成各种电影情节方面，Wan2.2-S2V 已经取得了相当进步，整体自然度和人物动作流畅性有了大幅增强。

网友们更是集体开启了好评模式：

既然新模型如此备受关注，那我们不得赶紧上手体验一番（doge）。

让马斯克还原生活大爆炸经典台词

打开通义万相官网，操作界面长下面这样（目前每日登录官方会赠送 50 积分可用于体验）：

注意，音频部分既可以从本地上传，也支持从声音库中选择合适的配音演员，顶部可直接输入指定台词。

这里我们请出了老演员马斯克，然后配上了他客串《生活大爆炸》的台词：

I ’ m washing dishes. Well, I was on the turkey line, but I got demoted for being too generous with the gravy.

小试牛刀后，Wan2.2-S2V 很快就生成了以下视频：

有一说一，其对口型能力还是相当不错的，唇形和台词基本都能对上。

而且这里我们只是简单给大家打个样，欢迎大家自行探索更多玩法（doge）。

不过在此之前，咱们继续康康其他网友的实测分享吧 ~

一位日本小哥首先出场，直接用 Wan2.2-S2V 生成了动漫人物朗诵诗的情节，是不是很有动画内味儿了。

或者用来整活儿发朋友圈，制作人物贴画唱歌视频：

而且类似大段 rap、演绎经典影视剧的尝试也不在少数，这里就不一一列举了。

那么最后的问题是——

Wan2.2-S2V 怎么做到的？

背后技术细节

根据官方透露，Wan2.2-S2V 采用了多项创新技术。

在模型训练上，通义万相团队构建了超 60 万个片段的音视频数据集，通过混合并行训练进行全参数化训练，充分挖掘了模型的性能。

然后基于通义万相视频生成基础模型能力，它融合了文本引导的全局运动控制和音频驱动的细粒度局部运动，从而实现复杂场景的音频驱动视频生成。

同时通过引入AdaIN+CrossAttention 两种控制机制，来让音频和画面锁死，解决同步问题。

搞定这些基础之后，为了实现长视频生成，模型还利用层次化帧压缩技术，大幅降低了历史帧的 Token 数量——

将 motion frames（历史参考帧）的长度从数帧拓展到 73 帧，从而实现了稳定的长视频生成效果。

此外，通过多分辨率训练、支持模型多分辨率的推理，模型最后还能支持不同分辨率场景（如竖屏短视频、横屏影视剧）的视频生成需求。

截至目前，加上此次发布的 Wan2.2-S2V，阿里通义基本已经聚齐了视频生成 " 全家桶 "——

显而易见，AI 视频生成正在迎来 " 通义时刻 "。

立即体验：

通义万相官网：https://tongyi.aliyun.com/wanxiang/generate

阿里云百炼 API：https://bailian.console.aliyun.com/?tab=api#/api/?type=model&url=2978215

开源地址：

Github：https://github.com/Wan-Video/Wan2.2

魔搭社区：https://www.modelscope.cn/models/Wan-AI/Wan2.2-S2V-14B

HuggingFace：https://huggingface.co/Wan-AI/Wan2.2-S2V-14B

参考链接：

[ 1 ] https://x.com/Alibaba_Wan/status/1960350593660367303

[ 2 ]

[ 3 ] https://x.com/hazimeno_ipoo/status/1960365063824621734

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

专属 AI 产品从业者的实名社群，只聊 AI 产品最落地的真问题 扫码添加小助手，发送「姓名 + 公司 + 职位」申请入群～

进群后，你将直接获得：

最新最专业的 AI 产品信息及分析

不定期发放的热门产品内测码

内部专属内容与专业讨论

点亮星标

科技前沿进展每日见

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

799美元起！iPhone17全系价格曝光

财经新闻 6小时前

荣耀Magic V5将登陆英国旗下折叠屏份额在欧洲直追三星

数码测评 2小时前

苹果9月发布会四大产品线或缺席 Mac新品跳票至明年

数码测评 4小时前

36氪2025AI Partner百业大会

36氪 2小时前

全球首个液冷！奥尼/Abee发布AMD锐龙AI Max+ 395迷你AI工作站

快科技 3小时前

群联否认Windows 11更新会损坏SSD：4500小时测试仍无法重现建议用户使用散热器

快科技 3小时前

罕见！RTX 5090发生电容爆炸：散热片都被炸弯

快科技 4小时前

微软向更多用户开放云游戏功能

快科技 4小时前

马斯克：星舰飞船捕获可能在第13至15次飞行时进行

快科技 4小时前

小米澎湃OS 3今天发布首批Beta版测试机型8月29日推送

快科技 6小时前

与理想小鹏分道扬镳靳玉志：华为辅助驾驶不会走VLA路径

快科技 6小时前

追觅造车：2027年亮相，对标布加迪威龙

时代财经 2小时前

路由器组网最全攻略：除有线 Mesh，Wi-FI组网也能大幅改善信号

雷科技 4小时前

实现新奇量子物态！祝贺中国科学家

参考消息 3小时前

iPhone 17发布前夕 iPhone 16 Pro系列不降反涨

太平洋科技 15分钟前

量子位

觉得文章不错，微信扫描分享好友

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频剪辑

AI视频剪辑

AI智能客服

AI工具箱

AI写稿助手

AI口语陪练

我的订阅

阿里开源 14B 电影级视频模型！实测来了：免费可玩，单次生成时长可达分钟级

宙世代

一起剪

相关阅读

799美元起！iPhone17全系价格曝光

荣耀Magic V5将登陆英国 旗下折叠屏份额在欧洲直追三星

苹果9月发布会四大产品线或缺席 Mac新品跳票至明年

36氪2025AI Partner百业大会

全球首个液冷！奥尼/Abee发布AMD锐龙AI Max+ 395迷你AI工作站

群联否认Windows 11更新会损坏SSD：4500小时测试仍无法重现 建议用户使用散热器

罕见！RTX 5090发生电容爆炸：散热片都被炸弯

微软向更多用户开放云游戏功能

马斯克：星舰飞船捕获可能在第13至15次飞行时进行

小米澎湃OS 3今天发布 首批Beta版测试机型8月29日推送

与理想小鹏分道扬镳 靳玉志：华为辅助驾驶不会走VLA路径

追觅造车：2027年亮相，对标布加迪威龙

路由器组网最全攻略：除有线 Mesh，Wi-FI组网也能大幅改善信号

实现新奇量子物态！祝贺中国科学家

iPhone 17发布前夕 iPhone 16 Pro系列不降反涨

最新评论

量子位

热门推荐

热门订阅 换一批

硅基星芒

荣耀Magic V5将登陆英国旗下折叠屏份额在欧洲直追三星

群联否认Windows 11更新会损坏SSD：4500小时测试仍无法重现建议用户使用散热器

小米澎湃OS 3今天发布首批Beta版测试机型8月29日推送

与理想小鹏分道扬镳靳玉志：华为辅助驾驶不会走VLA路径

热门订阅换一批