文 | 世界模型工场
4 月 8 日,匿名视频大模型 HappyHorse 1.0 突然空降 Artificial Analysis Video Arena 榜单。
短短 48 小时,它在文生视频和图生视频赛道双双登顶。

过去很长一段时间,视频大模型这条赛道的格局几乎默认,字节的 Seedance 稳坐头把交椅,快手的可灵紧随其后。
正因如此,阿里 HappyHorse 的冲顶,才显得格外惊艳。
为什么一直在视频赛道声量不高的阿里,突然在马年来了一场 " 黑马逆袭 "?
阿里究竟布下了怎样的组织棋局,才敢让一匹 " 快乐马 " 以匿名方式去硬刚全球?

过去外界提到阿里的视频生成,通常想到的是通义万相。
它长期是阿里公开的一条视频模型主线,并持续在迭代。
4 月 7 日刚发布的 Wan2.7-Video,把复杂动作、音画同步、长视频生成和视频编辑一起端了出来。
然而,通义万相并不是这条赛道声量最高的玩家,直到 HappyHorse 的出现打破了这一固有认知。
这也让外界知晓,在视频模型上,阿里内部并不只有一条线。
在阿里最新一轮架构调整中,通义万相和 HappyHorse 的团队都被划入了 ATH 事业群,但隶属于两条不同的组织线:
万相归通义大模型事业部,HappyHorse 来自 AI 创新事业部,前者做底层模型,后者靠近场景创新。
这很像是阿里内部不同团队围绕视频大模型进行的并行探索,带有一定 " 内部赛马 " 的味道。
结果很明显,HappyHorse 意味着阿里 ATH 事业群内部,已经有了第二支具备顶级多模态模型训练能力的团队。
更令人意外的是,据阿里方面透露,近期还将上线另一款与 HappyHorse 不同的多模态模型。
这表明阿里已经开始重新定义视频和多模态在自己 AI 战略里的位置。
外投生态 " 双保险 "
阿里的棋盘,才刚刚掀开一角。
快乐马是阿里内部率先冲线的标兵,就在同一时间,阿里成为生数科技 B 轮 20 亿的领投方。
生数科技,这家清华系视频大模型独角兽,旗下 Vidu 多模态大模型长期位于 Artificial Analysis 视频榜单前 10。
而在此前,AI 视频生成领军企业爱诗科技的领投方也是阿里。
这不是锦上添花,而是赤裸裸的 " 双保险 "。
阿里内部,多个团队并行,证明我也能做出顶级模型,抢占技术话语权;
阿里外部,绑定外部最有潜力的路线,抢占生态位。
阿里这一连串动作,绝不是临时起意,而是把过去几年所有的低调积累一次性引爆。
它在告诉全行业,阿里在视频大模型赛道,不再是那个声量不高的陪跑者,而是直接抢跑道的顶级选手。
为何重押视频模型?
对阿里来说,视频大模型发展到今天,已经不是一个试验品了,而是下一轮多模态竞争的关键入口。
文本模型可以拼参数、拼推理、拼价格,但视频模型不一样。
它同时考验时序一致性、物理运动、镜头调度、音画同步和推理效率,谁能在这里站住,谁才更有资格说自己真正掌握了多模态。
Wan2.7-Video 和 Happyhorse 的集中发布,本身就说明阿里正在把视频和多模态当成能力制高点来打,而不是边缘功能。
更关键的是,阿里看中的也不只是视频生成本身,而是视频背后衍生出的可能性。
目前,阿里正在把 AI 重点放到 Agent 与自身庞大业务体系的连接上,而生数这轮融资,则把资金明确指向世界模型。
阿里的意图已经很清楚:
视频只是入口,后面连着的是视频理解、多模态 Agent、新交互方式,甚至更远一点的世界模型叙事。
这不是在押某一个视频模型或者产品,而是在提前卡位整个多模态带来的技术和商业链条。
结合今年初,阿里宣布未来三年投入至少 3800 亿元做 AI 和云基础设施,这意味着阿里必须去找那些既能证明技术高度、又能持续消耗算力和云资源的方向。
视频显然是最符合这个逻辑的赛道之一。
在基础设施、组织建制和生态投资都到位之后,阿里终于决定把这块高地当成主战场来打。
这一仗,阿里重新改写了自己在多模态时代的位置。
下一匹马,已经准备出栏了。