关于ZAKER 合作
经济观察报 23分钟前

AI 视频迎来了它的 DeepSeek 时刻

你是一个非常有创意的普通人,你曾经有一个梦想,希望把自己脑海中的点子都用视觉形态展示,比如拍成动画、电影、电视剧等等。但你苦于资金和资源,无法实现。直到看到 PixVerse R1 后,你感觉到,自己的梦想好像要成真了。

1 月 13 日,国内 AI 视频初创公司爱诗科技发布了一款通用实时世界模型 PixVerse R1;本周,该模型已升级支持 HD 画质。众多关注 AI 视频的大咖惊叹:AI 视频行业的 DeepSeek 时刻到了。

PixVerse R1 改变了视频生成的逻辑。之前,用户需要输入文字或图片生成视频,还需要等待几秒钟甚至几分钟。但使用 PixVerse R1,用户即使不输入提示词,PixVerse R1 也会自动生成视频,它就像一个能无限生成内容的数字世界,可以让人沉浸遨游。在这个世界里,用户的提示词有一种言出法随的效果,输入的指令有多快,PixVerse R1 画面的改变就有多快。

在 YouTube 上,已经有普通用户用它生成了一部 90 分钟的电影。看到 PixVerse R1 价值的影视公司已经开始行动。1 月 19 日,中国儒意战略投资爱诗科技,双方也宣布进行版权共享,建立包括影视、游戏、流媒体等多方面的战略合作伙伴关系。如同国外迪士尼与 OpenAI 合作一样,国内影视巨头和 AI 科技公司也开始强强联手,开启 "AI + 内容 " 的下一代互动体验。

无限生成

在 PixVerse R1 官网,有 10 多个模拟世界参考入口,都能体验这款新产品的能力。

初始风格包括战场、卡通、赛博朋克等,风格各不相同。但实际上,体验过程中,每一个都可以改换成其他风格。

比如打开卡通风格,你就像置身任天堂的马里奥大世界,随着画面前进看到花花绿绿的建筑、正在漂浮的摩天轮、粉色的云彩、憨态可掬的小动物。但当你输入 " 一个虫洞来临,你正在宇宙穿梭 " 后,风格会转换为暗黑系太空探索,主角的人生轨迹也因此改变。

一位深夜体验完 PixVerse R1 的用户发帖说:" 你就是这个世界的上帝 "。在这个数字世界里,主角会因为你的一句话,一个指令改变人生。

目前 PixVerse R1 每个模板只能体验 5 分钟。爱诗科技内部人士称,主要是因为算力消耗太大,不得不限制。若是没有算力困扰,理论上,就是无限生成视频。

根据 PixVerse R1 披露的技术报告,PixVerse R1 用的是 Omni 原生多模态架构。原生的意思是,从一开始,文字、图片、音频、视频就在同一个架构里训练,用同一套 " 语言 " 处理。模型看到的不是 " 文字 + 图片 + 声音 " 的拼盘,而是一条统一的 Token 流。

PixVerse R1 采用了自回归流式生成,这意味着模型生成下一帧的时候,会参考前面已经生成的内容。更关键的是它有 " 长期记忆 ",不只是记住上一帧,而是能记住此前已经输入的信息。

此外,PixVerse R1 还实用了瞬时响应引擎,它可以把传统扩散模型所需的 50+ 采样步数压缩至惊人的 1 – 4 步,计算效率提升数百倍,让动态画面进入人眼可感知的 " 即时 " 响应阈值,让实时生成成为可能。

这种能力与一些伪实时生成形成鲜明差别。当下虽然有一些模型宣称 " 实时生成 ",但大多数是 " 伪实时 ",本质上还是 " 先渲染、后播放 "。用户只是等待时间很短,没注意到之前的渲染。

PixVerse R1 可以把视频生成转变为无限、连续和互动的视觉流。这代表了视听媒体的创建、体验和共享的重大演变,标志着向能够根据用户意图进行即时适应的智能、互动媒体的范式转变。

价值有多大

PixVerse R1 产品上线 6 天后,爱诗科技宣布,与中国儒意达成战略合作,中国儒意 1420 万美元的战略投资爱诗科技,并开放优质版权内容共享,双方将携手探索人工智能技术在影视、流媒体及游戏等内容生产与运营中的创新应用。

中国儒意是港股上市公司,旗下儒意影业近年主导出品《唐探 1900》《第二十条》《你好,李焕英》《热烈》《送你一朵小红花》等电影作品,累计票房超 400 亿元;同时打造了《我的阿勒泰》《追风者》《老酒馆》《琅琊榜》《芈月传》等著名电视剧。

中国儒意公告显示,爱诗科技创新的多模态人工智能大模型技术在影视行业中的应用具有巨大潜力。双方将共同创建针对专业影视领域的人工智能工具,推动影视创作方式的变革。

"PixVerse R1 对长镜头还有长片的意义是很重大的 ",一位知名 AI 创作者称,R1 开启了一个视频创作的新阶段,虽然目前画质和可控性还无法投入到正式创作中,但他相信,未来迭代后的版本会是一个很重磅、里程碑式的产品。

PixVerse R1 的与传统视频的根本区别是,传统视频是 " 记录过去的成品 ",而 PixVerse R1 生成的是 " 正在发生的现在 "。它是一个可交互的数字生命体,用户不再是旁观者,而是参与者,可以随时干预内容走向,实现真正的 " 共创 "。

王长虎认为,这意味着,视频的生产与消费边界正在消融——用户在观看的同时,也能即时生成、编辑甚至再创作内容。这标志着新的 AI 技术将带来视频行业的新范式与新物种。

PixVerse R1 拥有的实时生成能力,以及世界模型能力,都是当前国内外巨头正在角逐,却还没有出现成熟产品的领域。

在实时生成视频领域,不少公司都在发力,不过到目前为止,只有 PixVerse R1 已经上线,其他公司都还没有上线相关产品。

世界模型赛道的玩家更多,但能够把实时生成和世界模型融合为一个正式产品,爱诗科技是全球的领先者。

有了实时生成能力的世界模型,能让环境和叙事随着用户互动而动态演变,可以使 AI 原生游戏和互动电影成为可能。开发者可以构建出以前不可能实现的应用,比如,在 AI 原生游戏中,其故事线并非预设,而是由 AI 与玩家共同即兴创作。再比如,在一个虚拟社区里,其中的角色和环境会根据与用户的互动持续演化,形成一个 " 活 " 的数字生态。

一位资深游戏从业者说,他体验了 PixVerse R1,就像 2023 年第一次用到 mid journey 时一样震撼,感受新鲜而颠覆,也许不太完美,但充满了想象空间。据了解, R1 发布后,已经有多个游戏公司人士找到爱诗科技,探讨产品与游戏结合的可能性。

这种新型的互动系统,可以使互动媒体、AI 原生游戏和互动电影体验、实时 VR/XR 和沉浸式模拟、创意和教育系统、自适应媒体艺术和互动装置、实时学习和培训环境、模拟和规划、实验研究和情景探索、工业、农业和生态模拟等新事物都成为可能。这些新领域目前仍是无人车,随着 PixVerse R1 的发布,无人区将有人迈出第一步。

为什么是爱诗

无论是实时生成还是世界模型,都不算是新概念。但之前,始终没有公司能把这两个技术正式落地。爱诗科技发布的 PixVerse R1,是全球率先支持最高 1080P 分辨率通用实时世界模型。

爱诗科技并不是无名之辈。这家成立于 2023 年的 AI 视频公司,目前已经在全球 AI 视频赛道位居前列。用户层面,截至 2025 年第三季度,其全球用户已突破 1 亿,月活用户超 1600 万,其产品还入选了硅谷顶级风投 a16z 的 " 全球 Top50 生成式 AI 消费级移动应用 " 榜单。商业表现上,公司在 2024 年 11 月启动商业化后,不到一年时间月收入增长超过 10 倍,年度经常性收入(ARR)达到 4000 万美元。

这家公司的成绩主要得益于技术实力。其自研的 PixVerse 模型在两年内迭代五个大版本,2023 年 10 月,爱诗科技在成立仅 6 个月后即推出 PixVerse V1 版本,率先发布了业内可生成 4K 质量视频的 AI 视频生成模型,时间早于 Sora 模型的发布。彼时的 2023 年大语言模型火爆、视频模型确实遇冷非共识的时候,爱诗笃定了这个方向。

最新推出的 PixVerse PixVerse R1 更是号称全球首个通用实时世界模型,实现了用户与生成视频的实时交互,将技术竞争推向了 " 实时生成 " 的新维度。

爱诗科技创始人兼 CEO 王长虎有 20 年计算机视觉与 AI 领域经验,曾是字节跳动视觉技术负责人,主导过抖音、TikTok 等产品的技术研发。对于此次最新技术突破,王长虎表示:"PixVerse PixVerse R1 是全新的媒体形式。第一次,AI 可以基于用户的意图实时生成一个持续演化、物理上合理的世界。传统视频是被记录的历史,而 PixVerse PixVerse R1 开创了‘正在发生的现在’的实时生成新纪元。无论是 AI 原生游戏、互动电影,还是生成式直播电商体验,叙事都能‘所想即所现’(As You Think)。创作与消费的边界逐渐模糊:视频消费者同时也是创作者,能够在观看的同时立即调整和生成新内容。我们相信,智能化媒体应实时响应用户意图,让每个人都能成为动态叙事的创作者。"

相关阅读

最新评论

没有更多评论了