
没错,就是两个月前在 AI 圈刷屏的那个 3D 世界生成模型。李飞飞旗下的 World Labs 刚刚官宣向全体用户开放,还一次性放出了一大波新功能。
多模态生成:支持文本、单图、多图 / 视频、3D 布局等多种输入方式
AI 原生编辑:可对生成的 3D 世界进行局部替换和结构调整
世界扩展与组合:自动填充边缘区域,拼接多个场景
Chisel :用方块搭框架,AI 自动填充风格细节
全格式导出:支持高斯点云、三角网格、视频等多种格式,可直接导入游戏引擎

附体验地址:https://marble.worldlabs.ai/
李飞飞放大招,一句话生成完整 3D 世界
先直接上案例,看看 Marble 在文本生成上的真实水平。

如图所示,一个完整的 3D 厨房场景就这样呈现在我们面前,木质家具、铜制器皿、光影细节,一应俱全。
更考验理解能力的来了。看看这个抽象描述:

面对这种跨越时空的混搭风格,AI 依然能准确拿捏。
我自己也做了一轮测试。尝试生成一个森林场景后发现,虽然苔藓贴图略显重复,但树干纹理细节清晰,林间若隐若现的雾气也营造出了应有的氛围感。

单图生成:丢一张图片进去,AI 自动补全 360 度全景视角
多图 / 视频生成:从不同角度拍几张照片,AI 自动拼接成完整 3D 空间
3D 布局生成:用基础几何体搭建框架,AI 负责填充所有细节


而生成只是第一步,更值得关注的是后续的编辑能力。
Marble 还是业内首款原生集成 AI 编辑工具的模型,可以对生成的世界进行深度改造。比如在局部替换中,想移除垃圾桶?一句话搞定,AI 会自动处理场景和光影变化。




简单来讲,Chisel 把「结构」和「风格」彻底分离:
第一步:用立方体、平面等基础几何体搭建空间框架(就像玩乐高)
第二步:写一段文本描述视觉风格(比如「现代艺术博物馆」或「斯堪的纳维亚风格卧室」)
第三步:AI 自动将框架填充成完整的 3D 世界
更厉害的操作是,同一套框架,换个文本提示,能生成完全不同风格的场景。比如框架保持不变,提示词改为「现代艺术博物馆」,得到的是极简白墙配抽象画作。

又或者,框架保持不变,提示词改为「北欧卧室」,呈现的是温馨木质家具配冰川窗景。

这种玩法有点像前端开发里 HTML 定结构、CSS 定样式的逻辑,但应用到 3D 建模领域就显得格外高效。正如 World Labs 联合创始人 Justin Johnson 在采访演示时说:「我可以直接选中代表沙发的 3D 块,拖动到别的位置。」
传统建模软件里需要调整许久的操作,在 Marble 里变成了拖拽方块……
此时此刻,建模师们的心情想必很复杂。
那么,创建完成的 3D 世界该如何使用?Marble 提供了三种导出方案:
高斯溅射 ( Gaussian Splats ) :最高保真度的表示方式,适合实时渲染,可以直接在浏览器里运行。
三角网格 ( Triangle Meshes ) :分为低精度碰撞网格和高精度渲染网格,可以直接导入 Unity、Unreal Engine 等游戏引擎。
视频格式:支持像素级镜头控制,还能用 AI「增强」——自动添加烟雾、火焰、水流等动态效果。

官方新闻稿里的大部分视频,都是直接用 Marble 渲染生成的。通过串联这整套工具链串联,从概念到可用资产的流程被极大简化。

游戏开发者可以用 Marble 生成背景环境,导出到引擎里再添加交互逻辑;影视团队可以用它快速搭建场景预览,进行镜头规划;VR 内容创作者甚至可以直接把生成的世界放进 Vision Pro 或 Quest 3 里体验。
好家伙,兜兜转转我们还是回到了元宇宙。
定价策略方面,Marble 用了分级订阅制:
免费版:每月 7000 点数,最多生成 4 个世界,支持文本 / 图像 / 全景输入。适合尝鲜用户,但高级功能都被锁定。
标准版(20 美元 / 月):每月 20000 点数,12 个世界,解锁多图 / 视频输入、Chisel 模式、基础导出功能。
专业版(35 美元 / 月,首月 1 美元):40000 点数,25 个世界,支持场景扩展、视频增强、高分辨率网格导出,附带商业使用授权。
旗舰版(95 美元 / 月):120000 点数,75 个世界,全功能解锁。

Marble 发布后,各方反应相当两极化。
Y Combinator CEO Garry Tan 在推特上直言:「李飞飞是一个传奇人物,而这次发布意义重大。」一些独立游戏开发者和 VR 创作者也在社交媒体上表态,认为 Marble 大幅降低了 3D 内容制作的门槛。

最近的游戏开发者大会(GDC)调查显示,三分之一受访者认为生成式 AI 对游戏行业带来负面影响,比前一年上涨了 12%。关注点包括:知识产权侵权、能源消耗过高、AI 生成内容质量下降、导致行业裁员等。《
Wired》此前报道,包括 Activision Blizzard 在内的游戏公司,正在用 AI 压缩成本和应对人员流失。
面对这些质疑,Justin Johnson 的回应是:「Marble 不是用来完全替代游戏制作流程,而是为你提供可以直接使用的资产。」但实际情况会不会如他所说,还得看市场怎么用。
李飞飞的北极星:空间智能
就在 Marble 发布前几天,李飞飞专门发表了一篇长文阐述她的愿景——空间智能(Spatial Intelligence)。
核心观点可以总结为:
大语言模型虽然语言能力很强,但对物理世界几乎一无所知。它们无法准确估计距离、方向,无法在脑中「旋转」物体,也无法预测基本的物理规律。
对比之下,人类智能的核心不是语言,而是对三维空间的理解和操作能力。从驾驶汽车到接住钥匙,从设计建筑到发现 DNA 双螺旋结构——都依赖空间智能。

近期(创造力):游戏、电影、建筑设计(Marble 目前在做的)
中期(机器人学):通过模拟环境训练机器人,让它们学会在真实世界中行动
长期(科学突破):药物研发、材料科学、医疗诊断、沉浸式教育
博客中,李飞飞明确表达:「如果没有空间智能,我们对真正智能机器的梦想就无法实现。」
愿景是宏大的,但现实更复杂。
世界模型这个赛道,也不止 World Labs 一家在较劲。
目前市面上还有这么几位选手:Decart 推出了免费演示版,主打实时生成;Odyssey 同样提供免费试用,但功能较基础;Google Genie 还在研究预览阶段,尚未商业化。

更关键的是,Marble 率先实现了商业化落地,免费版加付费订阅的模式已经开始变现。从工具链的完整度来看,Marble 也是最全面的,从生成到编辑再到导出,整个流程一气呵成,不需要在多个平台之间倒腾。
从 ImageNet 到空间智能,李飞飞的学术生涯一直在做同一件事:让机器理解视觉世界。ImageNet 教会了 AI「这是什么」。而 Marble 想教会 AI「这在哪里、如何运动、怎么交互」。
前者催生了深度学习革命。后者会不会引爆下一场范式转移?现在下结论还太早。但至少目前看来,这个方向足够性感,也足够硬核。
OpenAI 继续卷 LLM,李飞飞押注空间智能……这场技术路线的豪赌,胜负或许就在这几年揭晓。