钛媒体 App 1 月 29 日消息,蚂蚁灵波科技于 1 月 29 日正式开源发布世界模型 LingBot-World,在视频质量、动态程度、长时一致性等关键指标上达到与 Google Genie 3 相当的水平。该模型突破性地实现了近 10 分钟的无损连续视频生成,有效解决了长时漂移问题。在交互性能方面,模型支持 16FPS 的生成吞吐,端到端延迟控制在 1 秒以内,用户可通过键盘、鼠标实时控制角色与视角,并利用文本指令触发环境变化。
此外,模型具备 Zero-shot 泛化能力,仅需输入单张真实照片或游戏截图即可生成可交互视频流。该技术为具身智能、自动驾驶等领域提供了高保真的数字训练环境,支持复杂长程任务的低成本模拟训练。目前模型权重及推理代码已面向社区开源。(广角观察)