48 小时见证 AI 新战场：阿里入局腾讯开源群核上市，世界模型迎来 ChatGPT 时刻了吗？

中国 AI 产业接连上演三场重磅戏码。

上周 4 月 16 日至 17 日，短短 48 小时内，阿里云发布世界模型 HappyOyster（快乐生蚊），腾讯同日开源混元 3D 世界模型 2.0，而专注空间智能的群核科技则于次日登陆港交所，成为 " 全球空间智能第一股 "。这或许并非巧合，他们正在释放一个清晰信号：世界模型赛道正从技术探索迈向商业化临界点。

当 Google DeepMind 在 2025 年 8 月发布 Genie 3 时，行业还在讨论 " 什么是世界模型 "；八个月后的今天，中国厂商已用集体行动给出答案：这是一场关乎 AI 未来十年走向的基础设施之争。

据笔者统计，截至 2026 年 4 月，全球已有至少 12 家主要玩家布局世界模型 / 模拟器赛道，包括 Google、OpenAI、Meta、NVIDIA 等巨头，以及群核科技、Runway 等垂直领域创新企业。其中，群核科技 IPO 超额认购 530 倍、上市首日涨 144%、市值超 300 亿港元的资本热情，与阿里、腾讯的战略级投入形成呼应。

一个关键问题浮出水面：世界模型会不会成为继 ChatGPT 之后的下一个现象级突破？

48 小时三大事件：从技术发布到资本验证

2026 年 4 月 16 日，阿里云 ATH 创新事业部（Token Hub）正式发布世界模型 HappyOyster。这款产品被定位为 " 世界模拟器 " 而非单纯的视频生成工具，核心功能包括漫游模式（支持 1 分钟连续实时位移）和导演模式（支持 3 分钟以上 480p/720p 画面）。

HappyOyster 采用原生多模态 + 长时序建模技术路线，与谷歌 Genie 3 同属 " 生成式视频派 "，但在交互时长上实现突破。值得注意的是，此时距离阿里云在 2026 年 3 月财报会上宣布 " 五年内云 +AI 收入超 1000 亿美元 " 目标仅过去不到一个月。

财报数据显示，阿里云 2026 财年 Q3 收入同比增长 36%，AI 相关产品收入连续 10 个季度保持三位数增长。HappyOyster 的发布，既是技术实力的展示，更是阿里 AI 战略从 " 大模型军备赛 " 转向 " 世界模型基础设施 " 的关键落子。

同样在 4 月 16 日，腾讯混元团队宣布开源 Hunyuan3D 2.0（HY-World 2.0）。与阿里的闭源策略不同，腾讯选择将这款 3D 世界模型完全开源，并支持与 Unity 等游戏引擎无缝对接。

HY-World 2.0 的核心差异化在于 " 可导出性 " ——生成的 3D 资产文件（Mesh/3DGS/ 点云）可直接用于二次编辑，而非仅能观看的视频。这一设计直指游戏开发、影视预演等 B 端场景的工程化需求。

腾讯的开源策略并非偶然。早在 2024 年，腾讯就通过开源混元系列大模型积累了开发者生态。此次 HY-World 2.0 的开源，意在抢占 " 空间智能基础设施 " 的生态位，与阿里形成差异化竞争。

2026 年 4 月 17 日，群核科技（Manycore Tech，股票代码 0068.HK）在港交所挂牌上市。招股书显示，公司 2025 年实现营收 8.2 亿元，毛利率高达 82.2%，经调整净利润 5710 万元，成功实现从亏损到盈利的跨越。

与其他玩家的 " 烧钱研发 " 模式不同，群核科技的独特之处在于已验证的商业闭环。公司围绕空间智能构建了 " 空间编辑工具 - 空间数据 - 空间大模型 " 的业务飞轮，核心产品包括 SpatialLM、SpatialGen、SpatialVerse 等。

据群核科技创始人兼 CEO 黄晓煤在上市后交流中表示：" 我们用了 15 年时间积累了全球最大的物理正确空间数据集，这是短期无法复制的护城河。"

IPO 阶段，群核科技引入泰康人寿、阳光人寿、广发基金、Redwood、Mirae Asset 等全明星基石阵容，合计认资 4.55 亿港元。香港公开发售获 1591 倍认购，国际发售获 14.46 倍认购，上市首日收盘价 18.6 港元，涨 144%，总市值超 300 亿港元。

这三起事件的集中爆发，标志着中国厂商在世界模型赛道已从 " 跟随者 " 转变为 " 定义者 "。阿里、腾讯、群核分别代表了三种不同的战略路径：阿里的 " 云 + 模型 " 一体化、腾讯的 " 开源生态 " 卡位、群核的 " 垂直盈利 " 验证。这种多元化的竞争格局，为全球世界模型的发展提供了中国样本。

三大流派与 12大玩家

随着 " 世界模型 " 概念迅速走红，一个尴尬的现实是：不同玩家口中的 " 世界模型 "，可能根本不是同一回事。正如研究员 Chris Paxton 所言，这个术语 " 相当模糊 "。基于对 12 家主要玩家的技术路线梳理，逼着发现当前世界模型领域已形成三大主流流派，分别由不同的 AI 领袖押注，且暂无收敛趋势。

首先是生成式视频派（" 世界即视频 "），代表玩家包括 Google Genie 3、OpenAI Sora、阿里 HappyOyster、Runway GWM-1。这一流派的核心理念是通过视频生成技术模拟世界演化，认为 " 能够生成逼真视频就意味着理解了物理规律 "。

其技术特点是采用 Diffusion Transformer 或 AR-Transformer 架构，强调时序连贯性和画面质量，追求长时长生成（1 分钟以上）。Google Genie 3 作为该流派标杆，支持实时交互、每秒 24 帧生成、完全交互式 3D 宇宙。阿里 HappyOyster 则在交互时长上实现突破，漫游模式支持 1 分钟连续实时位移，导演模式支持 3 分钟以上画面。

优势在于直观、易理解，直接面向内容创作场景，商业化路径清晰。但短板同样明显：对物理规律的理解停留在表象，难以支撑机器人训练等硬核场景。

其次是抽象预测派（" 世界即因果 "），代表玩家为 Meta V-JEPA 2（Yann LeCun 主导）。其核心理念是反对像素级重建，主张学习世界的抽象表征和因果逻辑，认为 " 真正的世界模型应该是预测未来的抽象大脑 "。

Meta 首席 AI 科学家 Yann LeCun 是这一路线的最坚定拥护者。V-JEPA 2 采用 JEPA（联合嵌入预测架构），在 latent space 进行预测而非像素空间，强调因果推理和可解释性。据公开测试数据，V-JEPA 2 的运行速度是英伟达 Cosmos 的 30 倍。

优势在于更接近人类认知方式，适合决策规划任务，算力需求相对较低。但劣势同样突出：缺乏直观输出，难以直接应用于内容创作，商业化场景有限。LeCun 本人曾多次公开质疑像素级预测路线，认为那是 " 低效的表面功夫 "。

最后是空间智能派（" 世界即 3D"），代表玩家包括斯坦福 World Labs、腾讯 HY-World 2.0、NVIDIA Omniverse、群核科技。其核心理念是真正的世界模型必须理解三维空间和物体关系，能够生成可编辑、可导出的 3D 资产而非仅视频。

这一流派采用 3DGS、NeRF 等技术，输出可二次编辑的 3D 模型文件，强调几何稳定性和空间一致性，并与现有游戏 / 机器人工作流无缝对接。腾讯 HY-World 2.0 的核心差异化正是 " 可导出性 " ——生成的 3D 资产文件可直接用于游戏开发。

群核科技则更进一步，拥有全球最大的空间数据集（15 年积累），推出 SpatialLM 空间语言模型和 SpatialGen 空间生成模型，并开放 Aholo 空间智能开放平台。优势在于可直接用于游戏开发、机器人仿真，工程化落地最快。

劣势在于实时交互性受限，计算复杂度高，难以实现超长时序推演。

基于技术指标、产品成熟度、商业化进展三个维度，全球 12 家主要玩家可划分为三个梯队。

第一梯队（产品化领先）包括 Google Genie 3、阿里 HappyOyster、腾讯 HY-World 2.0、群核科技，共同特征是已发布可用产品，技术指标明确，具备实时交互能力，且有清晰的场景定位。其中，群核科技是唯一实现盈利的空间智能企业，2025 年营收 8.2 亿元，毛利率 82.2%。

第二梯队（技术独特但场景有限）包括 Meta V-JEPA 2、Tesla FSD、NVIDIA Omniverse，技术路线独特但聚焦特定垂直场景，不直接面向大众消费者。

第三梯队（早期探索）包括百度文心、字节豆包、Runway GWM-1、斯坦福 World Labs、OpenAI Sora，仍在技术验证阶段，商业化路径不清晰。具体对比详见下图。

中美博弈与商业化突围：谁在真正赚钱

在全球世界模型竞赛中，中美两国呈现出明显的差异化优势。美国的优势在于基础研究、算力垄断和数据资源。LeCun 的 JEPA 架构、DeepMind 的 AR-Transformer 等底层创新均来自美国实验室。NVIDIA GPU 和谷歌 TPU 的算力垄断，以及 YouTube 视频库、Instagram 图像库的数据优势，构成了美国玩家的天然护城河。

中国的优势则体现在工程化能力、应用场景和资本化进程。阿里、腾讯能够在 Google Genie 3 发布八个月后迅速推出对标产品，体现了强大的工程优化能力。游戏、影视、文旅等消费市场的巨大需求，为技术落地提供了丰富场景。而群核科技的上市，则标志着中国在空间智能赛道率先完成资本化布局。

但一个不容忽视的现实是：底层架构创新目前仍由美国主导，中国厂商更多是快速跟进和工程优化。HappyOyster 与 Genie 3 同属 " 生成式视频派 "，HY-World 2.0 的技术路线也与 World Labs Marble 高度相似。这种 " 跟随式创新 " 能否在长期竞争中胜出，仍需时间验证。

尽管技术层面百花齐放，但世界模型的商业化之路仍面临多重挑战。首要问题是推理成本。实时交互意味着更高的算力消耗，Genie 3 和 HappyOyster 均支持每秒 24 帧生成，但这背后的 GPU 成本如何消化？To B 场景中，哪些企业愿意为这项新技术买单？To C 场景中，普通用户为什么需要世界模型？

群核科技提供了一个可行样本。公司聚焦家装设计等垂直场景，通过 SaaS+API 服务模式实现盈利。2025 年 8.2 亿元营收、82.2% 毛利率、5710 万元净利润的数据，证明空间智能在特定场景下具备商业可行性。但这一模式能否扩展至通用世界模型，仍是未知数。

另一个关键变量是开源 vs 闭源的战略选择。Meta V-JEPA 2、腾讯 HY-World 2.0 选择开源，意在建立生态标准、吸引开发者；Google Genie 3、阿里 HappyOyster 选择闭源，意在保护核心技术、构建商业壁垒。

短期来看，闭源有助于保护投资回报；长期来看，开源方案可能凭借生态优势实现超越。此外，地缘政治风险也不容忽视。高端 GPU 出口管制对中国厂商的影响，数据跨境流动限制，技术标准分裂（中美各自主导的生态体系），都可能成为世界模型全球化发展的阻碍。

对于中国厂商而言，如何在有限的算力资源下优化模型效率，如何利用本土数据优势构建差异化壁垒，将是未来竞争的关键。

三种情景与终极逻辑：谁是下一站的基础设施

回到最初的问题：世界模型会不会是继 ChatGPT 之后的下一个现象级突破？基于当前技术进展和产业动态，钛媒体对世界模型的未来发展做出三种情景化推演。

乐观情景（概率 30%）：2028 年出现杀手级应用。假设技术瓶颈在 2-3 年内突破，长时序一致性和物理精度达到实用水平。某个垂直场景率先爆发，出现千万级用户的 killer app。头部玩家确立行业地位，世界模型成为 AI 基础设施，与具身智能、机器人产业深度融合。

2030 年后，世界模型可能真正成为 AGI 的 " 底层操作系统 "。

中性情景（概率 50%）：场景分化，长期共存。技术路线收敛至 2-3 种主流方案，但不同流派服务不同场景。生成式视频派主导内容创作，空间智能派主导游戏 / 机器人，抽象预测派主导决策规划。10+ 玩家淘汰至 3-5 家，但无明显赢家通吃。世界模型成为 AI 工具箱中的重要组件，而非替代 LLM 的下一代基础模型。

悲观情景（概率 20%）：泡沫破裂，回归理性。技术瓶颈长期无法突破，商业化进展缓慢。大部分玩家因资金压力退出，仅剩 Google、Meta 等巨头维持研发。" 世界模型 " 概念被证伪或重新定义，行业回归到更务实的 " 视频生成 +3D 建模 + 强化学习 " 组合方案。AGI 路径转向其他技术路线。

透过 48 小时三大事件的喧嚣，钛媒体观察到一个深层趋势：世界模型的终极竞争不是技术竞赛，而是生态竞赛。

Google 凭借 DeepMind 技术积累和 TPU 算力垄断，构建的是 " 技术 + 算力 " 双壁垒；阿里依托阿里云和企业客户资源，走的是 " 云 + 模型 " 一体化路径；腾讯通过开源策略，意在吸引开发者、建立游戏 / 影视生态；群核科技则用 15 年数据积累和盈利验证，卡位空间智能基础设施。

每一种策略都有其合理性，但最终胜出的，一定是能够构建最完整生态的那一家。这不仅需要技术领先，更需要场景落地、开发者支持、资本助力、政策友好的多维协同。

对于中国厂商而言，短期内的工程优化可以快速缩小差距，但长期来看，必须在底层架构创新上有所突破。否则，即便赢得某一轮产品竞赛，也难以在 AGI 时代的生态格局中占据主导地位。

2026 年 4 月的这 48 小时，或许会被后世视为 AI 发展的一个关键节点。阿里、腾讯、群核的集体行动，标志着世界模型从 " 实验室玩具 " 迈向 " 产业基础设施 "。但真正的 ChatGPT 时刻何时到来，取决于技术突破的速度，更取决于生态建设的深度。

在未来 2-3 年的窗口期内，我们或将见证第一批标杆案例的出现，也可能目睹部分玩家的黣然退场。唯一确定的是：谁掌控了空间，谁就能掌控物理 AI 的未来。而这一次，中国企业已经抢先站在了赛道最前方。（本文首发钛媒体 APP，文 | DeepWrite 秦报局，作者｜赵虹宇）

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

48 小时见证 AI 新战场：阿里入局腾讯开源群核上市，世界模型迎来 ChatGPT 时刻了吗？

宙世代

一起剪

相关阅读

梁文锋，坐不住了

用户买20TB+硬盘还在质保期坏了 东芝拒免费换新：我们愿原价退款

拿到大疆、美团投资后，智能派追赶拓竹，要打“老二”翻身仗

零门槛AI创作平台“灵珠”开启第一次内测

一加Ace 6至尊版官宣4月28日发布！与手柄合体秒变枪神掌机 FPS神器

机器人ToB规模化提速，数据短板仍是核心卡点

全球首款！QQ音乐畅听耳机发布：399元 十年VIP曲库免费听 立省2001元

宁德时代“小伙伴”、真空泵龙头申购，另有1只新股上市

天使投资人谈张雪：“热爱、专注、死磕，他想做的事一定能做成”

液冷是人形机器人“散热”最优解

问界启动老车型激光雷达升级服务并推增换购补贴

为什么越来越多人相信马斯克当初是对的

新一代高精密分流器检流模组发布，支持无需补偿的±0.3%电流检测精度

Rivian车主在Buc-ee’s使用特斯拉充电桩发现内置CCS适配器

荣耀机器人半马夺冠小插曲：途中撞观光车、单鞋飞落 仍强势夺冠

最新评论

钛媒体

热门推荐

企业资讯

用户买20TB+硬盘还在质保期坏了东芝拒免费换新：我们愿原价退款

全球首款！QQ音乐畅听耳机发布：399元十年VIP曲库免费听立省2001元

荣耀机器人半马夺冠小插曲：途中撞观光车、单鞋飞落仍强势夺冠