关于ZAKER 合作
钛媒体快报 49分钟前

蚂蚁灵波开源世界模型 LingBot-World,可交互长视频生成能力比肩 Genie3

钛媒体 App 1 月 29 日消息,蚂蚁灵波科技于 1 月 29 日正式开源发布世界模型 LingBot-World,在视频质量、动态程度、长时一致性等关键指标上达到与 Google Genie 3 相当的水平。该模型突破性地实现了近 10 分钟的无损连续视频生成,有效解决了长时漂移问题。在交互性能方面,模型支持 16FPS 的生成吞吐,端到端延迟控制在 1 秒以内,用户可通过键盘、鼠标实时控制角色与视角,并利用文本指令触发环境变化。

此外,模型具备 Zero-shot 泛化能力,仅需输入单张真实照片或游戏截图即可生成可交互视频流。该技术为具身智能、自动驾驶等领域提供了高保真的数字训练环境,支持复杂长程任务的低成本模拟训练。目前模型权重及推理代码已面向社区开源。(广角观察)

相关标签

相关阅读

最新评论

没有更多评论了
钛媒体快报

钛媒体快报

钛媒体快报频道

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容