36 氪获悉,近日,智象未来团队两项创新成果入选 ICCV 2025,分别聚焦于图像生成与视频增强两个方向。在图像生成方面,智象未来团队提出了全新去噪掩码自回归生成范式 De-MAR,De-MAR 框架通过双重令牌优化机制,创新性引入扩散头与去噪头模块。实验显示,De-MAR 在 ImageNet 和 MS-COCO 数据集上,FID 指标达 1.47 和 5.27,生成速度较 DiT-XL/2 快 45%。在视频增强方面,团队则推出了创新的生成式视频画质增强框架 GenVE,可生动还原毛发、衣物褶皱等细节,使视频画面更自然流畅。
36氪
9分钟前