36 氪获悉,10 月 27 日,美团 LongCat 团队发布并开源 LongCat-Video 视频生成模型,以统一模型在文生、图生视频基础任务上达到开源 SOTA,并依托原生视频续写任务预训练,实现分钟级长视频连贯生成,保障跨帧时序一致性与物理运动合理性。该团队认为,发布视频生成模型,是为探索 " 世界模型 " 迈出的第一步。未来,凭借精准重构真实世界运行状态的能力,LongCat 模型会融入自动驾驶、具身智能等深度交互业务场景。
36氪
25分钟前