关于ZAKER 合作

字节家的摇钱树 , 阿里腾讯都想抢

凭借原生音视频联合生成技术,HappyHorse 在画质与效率上展现优势,并有望与阿里电商生态深度融合。然而,视频生成赛道的高昂算力成本与商业化难题,正迫使所有玩家在技术突破与可持续盈利之间寻找平衡,一场关于生态落地与成本控制的大考才刚刚开始。

———— / BEGIN / ————

AI 短剧带来的极致成本优势与工业化生产效率,引爆了资本热情,也让 AI 视频赛道格局重构。

4 月初,一匹黑马杀出:视频生成模型 HappyHorse-1.0 在第三方测评平台 Artificial Analysis 登顶,文生视频 Elo 得分 1333、图生视频 Elo 得分 1392,双双超越字节跳动 Seedance 2.0 与快手可灵,成为不容忽视的新变量。

4 月 10 日中午,阿里下场 " 认领 "HappyHorse 为 "ATH 事业群 " 旗下的 AI 创新事业部自研,API 将在 4 月 30 日开放。

此前,阿里并非视频生成的核心玩家。但 3 月 16 日,阿里新成立以 Token 为核心的 "ATH 事业群 " 后,提升多模态能力变成了拉高 Token 效率的抓手——而 HappyHorse 可视为这场战略大转向的重磅成果之一。

不只阿里,科技巨头正在视频生成赛道集体压境。

凭借 Seedance 系列的生成质量与成熟商业化,字节跳动已构筑起显著壁垒。据了解,火山引擎面向企业开放的 Seedance API 接口,有些机构得到的最低年消费门槛高达 1000 万元。

以高门槛开放 API 的底气,来自市场的极度供不应求。《中国企业家》获悉,在火山引擎近期的招商会上,许多城市与火山引擎和视频生成业务洽谈合作,有城市为此投入了数千万、上亿元资金,将算力支持作为招商引资的重要配套。

另一巨头腾讯也已下场。知情人士向《中国企业家》透露,腾讯挖走了 Seedance 开发团队中的数名核心成员,计划在 5 月推出混元视频大模型新版本,与 Seedance 正面对垒。"5 月的视频模型赛道,将会格外热闹。"

阿里认真了

HappyHorse 亮相之前,阿里虽有通义万相视频模型,但表现始终不温不火。作为大模型生态的附属功能,万相此前在清晰度、运动连贯性、长视频稳定性等核心指标上,与 Seedance、快手可灵等有明显差距,也未打通专属商业化场景。

这一次,阿里好像认真了。HappyHorse 采用 150 亿参数,将文本、视频、音频三种模态 Token 置于同一序列联合建模,从底层解决了音画不同步、语气与表情不匹配等问题。

" 它的物理模拟更贴近真实环境。" 一位测评人士告诉《中国企业家》。另外,HappyHorse 原生支持七国语言唇形同步,词错误率显著降低。同时,它在成本与速度上表现优异:单张 H100 生成 5 秒 1080p 视频约 38 秒,DMD-2 蒸馏技术将去噪步骤压缩到了 8 步。

但 HappyHorse 的短板同样突出。

测评人士表示,在完成复杂动作与多人交互时,HappyHorse 易出现肢体错乱、轨迹不稳。相比于 Seedance,HappyHorse 更擅长镜头呈现,不擅长动作叙事。

在应用方面,HappyHorse 的 API 尚未开放,在内测中,其支持的时长仅为 5~10 秒,场景上限较低,更适合做短视频、广告、AI 漫剧素材,还难以支撑剧情长片。其本地部署也有门槛,需配备 H100 或 A100 显卡,消费级显卡无法运行。

阿里突然在视频模型战场投入火力,意欲何为?相关人士表示,HappyHorse 诞生于淘天未来生活实验室,或许意味着阿里希望其能与电商场景碰撞融合。

阿里拥有完整的商品、商家、交易与广告生态,但商品视频一直是中小商家的痛点:场景搭建、拍摄剪辑成本高,白底图难以展现卖点。而 AI 视频可批量生成多版本、多场景、多语言内容,大幅降低了创作门槛。

更关键的是,阿里的商品详情、用户评价、搜索行为、转化数据、直播表现等全链路信息,也可反向训练电商专属视频能力,让 HappyHorse 成长为懂电商、能带货的内容生产引擎。

但这条商业闭环要跑通,除了技术攻坚,还必须先解决阿里的算力问题。

接近阿里的人士向《中国企业家》透露,目前阿里内部 GPU 分配非常紧张。" 此前,像月之暗面作为阿里云大客户,虽然与 Qwen 存在竞争,还是能获得比较充足的算力。现在阿里要支持基模研发、电商、云服务多条战线,未来要重新考虑 GPU 的投入产出比了。"

而视频生成是算力消耗大户,如果 HappyHorse 逐步开放推广,算力需求更将指数级增长。这匹黑马能跑多快、多远,很大程度上取决于阿里能否破解算力这一核心瓶颈。

Seedance 的好生意被盯上了

尽管挑战重重,各大厂商仍争相涌入 AI 视频赛道,只因这是一门想象空间极强的生意。

目前,红果短剧等平台收一部剧的最高价格约 2000 元 / 分钟,一部常规短剧的时长约 120 分钟,价格约 24 万元。而市场上 AI 短剧的外包制作报价已经低至 400 元一分钟,甚至有团队用自动化工具实现了一天 800~1000 分钟的漫剧内容产出。

巨大的成本优势和生产效率,让 AI 短剧成为资本追逐的热点。有 AI 视频制作公司负责人告诉《中国企业家》,短短半个月,就有好几家资本来谈收购、并购,目前给他们的估值已超 5 亿元,但他们和合伙人都觉得,这个出价还不够 " 美丽 "。更有地方政府直接找上门来,希望直接独家买断公司的 AI 漫剧自动化生成工具。

Agent 技术的进展,也正让一人公司(OPC)大量涌现。几个擅长高效使用 AI 工具的员工,便能顶得上过去一个甚至几个团队的工作量。各地政府敏锐地捕捉到了这一趋势,纷纷对 AI 视频、AIGC、AI 短剧推出算力补贴、内容奖励、园区集聚等扶植政策,吸引 OPC 进入。

2 月 27 日,武汉东湖高新区发布 " 微短剧八条 ",对重大产业项目最高支持 5000 万元,爆款短剧单部奖励 50 万元。

3 月 10 日,上海市徐汇区发布《"AI+ 微短剧 " 产业扶持意见》,对头部企业最高给予 1000 万元发展支持,同时发放最高 100 万元算力券、100 万元语料券,并为 OPC 减免工位费用。

3 月 13 日,深圳市施行新版微短剧扶持政策:AIGC 微短剧单项目最高资助 200 万元。

需求的旺盛和政策扶植,让字节成为最早尝到甜头的公司。据《中国企业家》了解,虽然火山引擎向大型影视公司、内容制作公司、特定机构等开放的 Seedance API 接口 " 白名单 ",有些机构被要求 " 最低消费 "1000 万元 / 年,客户仍趋之若鹜。

接近火山引擎的人士告诉《中国企业家》,地方政府已将算力扶持作为招商引资的重要配套。一些 AI 短剧公司以 " 拼盘 " 接入 API,不少算力费用由政府出面解决,以吸引相关公司落地。

" 有些城市采购了火山 3000 万、7000 万,甚至过亿的费用,用于内容扶植。当然其产出的内容也将对本地税收和 GDP 产生极大拉动,这个账很好算的。"

清晰可见的变现路径,叠加千亿级的市场增量,点燃了巨头间的竞争热情。阿里、腾讯纷纷加码 AI 视频赛道,试图从字节手中分走一杯羹。

接近腾讯的相关人士向《中国企业家》透露,混元视频模型其实早就有了," 只是效果很差 "。近期,腾讯痛下决心," 开出高薪,差不多把 Seedance 开发组整个挖走了 "。新款模型大约 5 月上线,有望和 Seedance 掰掰手腕,在短时间内实现技术突破。

依托腾讯生态,混元新视频模型还有望深度融入到视频号的内容生产、分发、商业化全链路,放大腾讯的内容生产力与商业变现空间。

视频模型的高风险抉择

虽然所有人都看到了 AI 视频在短剧、电商、广告等领域打开的万亿级商业潜力,但这条赛道的烧钱速度,也远超想象。投入矛盾与定价分化,以及摆在巨头面前的规模化盈利困境,正在考验着各家的平衡智慧。

虽然火山引擎的收入不菲,但其算力成本负担依然沉重,收入中的绝大部分,都要用来采购 GPU 和支付电力成本。

4 月,火山引擎总裁谭待告诉《中国企业家》:" 我们去年已经修改了商业计划,把目标提升了不少。但目前我们还没有做 3 年的盈利规划,暂时没有这方面的具体安排。"

OpenAI 关停 Sora,更给狂热的市场泼下一盆冷水。视频生成的算力消耗,是大模型的上百倍甚至上千倍,即便全球最具财力的科技公司,也难以承受这种无底洞式投入。

OpenAI 虽宣称,关停 Sora 是为了将资源转向企业智能体、编码工具与具身智能等方向,但业内普遍认为,成本与付费严重倒挂才是核心原因:Sora 单条 1080p 的视频生成成本约 0.5~1 美元,而用户平均付费意愿不足 0.1 美元,根本无法支撑持续运营。

更深层的挑战,还来自于科技大厂技术路线的高风险抉择。业内人士向《中国企业家》指出:多模态任务过度消耗算力,在 Token 用量已经暴涨的情况下,厂商有再多算力依旧不够烧,要把算力留给谁,就成了关键问题。

由于忌惮视频的无底洞式算力投入,Google 始终不敢大规模开放 API,也未推出独立的视频生成 C 端应用。" 去年 Google 的多模态路线备受推崇,但今年便在 Agent 浪潮下被 Anthropic 赶超,现在只能说勉强留在牌桌上。大模型的核心技术路线,往往需要提前一两年布局,效果却要滞后显现。有时候真的像玄学。"

行业成本与收入失衡,近期利益和远期发展,迫使所有玩家重新审视视频模型的商业模式与定价逻辑,这也直接催生了行业内的定价策略分化。

摩根大通曾判断:头部领先模型可以维持溢价,追赶者则不得不通过降价抢占市场份额。

Sora 停服后,字节率先选择涨价。4 月 8 日,即梦宣布:基础、标准、高级会员的月度积分分别从 1080、4000、15000 下调至 725、2210、6160,积分缩水近六成,相当于变相涨价。

相比之下,Google 和快手则选择用降价换市场:谷歌在 3 月底放出的 Veo 3.1 Lite 版本,将 720p 视频生成价格压至 0.05 美元 / 秒。可灵紧随其后,推出会员限时 8 折优惠,部分图片生成功能甚至完全免费。

定价的两极分化,本质上是竞争烈度的直接体现。长期来看,平台、API、广告、电商都只是外层变量,决定胜负的关键因素仍然是:强化模型本身的同时,谁能在效果和成本之间找到最佳平衡点,谁能结合自身生态,找到不可替代的落地场景。

本文来自公众号:中国企业家杂志 记者:林秋艺 王怡洁 编辑:李原 何伊凡

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容