关于ZAKER Skills 合作
铅笔道 15分钟前

94 年小伙半年融资 30 亿,用游戏视频训练 AI

作者 | 铅笔道 黄小贵

编辑 | 铅笔道 祝枝杉

封面图 | ChatGPT 创作

看《堡垒之夜》的游戏录像,也能训练 AI?

没错,一家靠着海量游戏录像训练 AI 的公司 General Intuition,刚刚完成 3.2 亿美元(约合人民币 21.77 亿元)融资。

本轮由科斯拉风投领投,General Catalyst、谷歌前董事长施密特、亚马逊创始人贝索斯跟投。

General Intuition 公开披露的融资总额已达 4.54 亿美元,估值 23 亿美元。

游戏数据很值钱

General Intuition 纽约办公室有一个很有画面感的场景:

屏幕上,一个 AI 智能体在类似《堡垒之夜》的游戏环境里连续运行。旁边,一台四足机器人在办公室里走动。而驱动游戏智能体和机器人的,是同一个 " 大脑 "。

这个 " 大脑 " 不是从真实世界里一点点学出来的,而是先从游戏录像里学出来的。

这也是 General Intuition 能拿到大额融资的核心原因。它背后有一个别人很难复制的数据入口:游戏剪辑平台 Medal。

Medal 原本是给玩家上传、分享游戏高光时刻的平台。玩家在游戏里跳跃、转身、开枪、躲避、攀爬、撞墙、失败、反击,这些都被记录下来。

YouTube、X 上有大量游戏视频。General Intuition 看重的是另一层东西:动作标签。

General Intuition 来源:公开资料

也就是说,它不只知道画面发生了什么,还知道玩家在那一刻按了哪个键、移动了鼠标、做了什么操作。画面和动作同时存在,AI 就能学习一个更接近真实行动的问题:在一个环境里,看到眼前这些东西,下一步应该怎么做。

这和大语言模型训练文本有点类似。

大语言模型从互联网文本里学习语言规律。它看了很多句子,知道一个词后面可能接什么词。General Intuition 想做的,是让 AI 从游戏动作里学习行动规律。它看到一个角色面对墙壁、楼梯、敌人、障碍物、阴影变化,就要学会哪些动作有效,哪些动作无效。

General Intuition 为什么能想到用游戏录像来训练 AI?

这就得从创始人讲起。

OpenAI 尝试 5 亿美元收购

General Intuition 创始人 Pim de Witte 于 1994 年出生在荷兰,早年就和游戏关系很深。

他十几岁时曾通过搭建和运营一个私人 Rune Scape 服务器赚到 150 万美元。后来,他创办了 Medal。这个平台的功能很简单:让玩家录制、上传和分享游戏里的精彩片段。

最初,这看起来是一门游戏社区生意。玩家要晒操作,平台要做分发,游戏公司要流量。可是到了 AI 时代,这些游戏片段突然有了新的价值。

因为 AI 行业正在遇到一个新问题:文本数据已经被大量使用,但机器人、无人机、自动驾驶、游戏智能体需要的不是文字,而是行动数据。

一个机器人要在仓库里绕开货架,不能只靠读几本说明书。一个无人机要进入灾害现场搜救,不能只靠看静态图片。一个游戏 NPC 要表现得像真人玩家,也不能只靠预设脚本。

它们都需要理解空间、时间和因果。

比如,前面有一堵墙,不能继续往前冲;楼梯可以上去;阴影变化意味着光源和时间在变化;对手突然从右侧出现,玩家应该转向、躲避或反击。这些判断,人类玩家每天在游戏里做无数次。Medal 记录下来的,正是这些连续判断。

这就是 General Intuition 的数据壁垒。

Medal 一年可产生数十亿级别的视频上传,覆盖大量游戏环境。更重要的是,这些数据不是单一场景,而是横跨不同游戏、不同地图、不同视角、不同操作方式。对训练 AI 来说,这种多样性很关键。

如果只在一个仿真环境里训练,AI 很容易学会 " 应付考试 "。它知道这个房间怎么走,知道这个地图的规则,却未必能迁移到新环境。General Intuition 想利用游戏世界的多样性,让模型学到更底层的空间和行动规律。

OpenAI 都关注到了 Medal,曾尝试以 5 亿美元收购 Medal。

Medal 里的游戏行为数据记录了人类如何在虚拟环境里行动。对下一代 AI 来说,这可能比普通视频更有训练价值。

不到一年,融资 30 亿

General Intuition 就是基于这个判断成立的。

2025 年 10 月,它宣布完成 1.337 亿美元种子轮融资。不到一年后,又完成 3.2 亿美元 A 轮融资。这么短时间就募集了相当于 30 多亿人民币的资金。

General Intuition 创始团队 来源:公开资料

目前,General Intuition 团队约 25 人,Medal 约 65 人。

一个团队还很小的 AI 实验室,能在短时间内连续融资,靠的不是收入规模,而是投资人相信它手里握着一种稀缺训练资源。

General Intuition 的 AI 会先服务游戏行业。比如,今天很多游戏里的机器人玩家和 NPC,仍然是脚本驱动的。它们看起来聪明,其实只是按照规则行动。玩家熟悉之后,很容易看出破绽。

General Intuition 想做的,是让游戏角色在相同信息条件下行动。它看到的只是普通玩家能看到的画面,行动方式也和玩家类似。这样训练出来的 AI,不是简单知道地图后台数据,而是像人一样根据屏幕画面做判断。更真实的 NPC、更自然的陪练、更动态的游戏世界,都可能提升游戏体验。

不过,General Intuition 真正想做的,不只是游戏。

它关注的是 "spatial-temporal reasoning",也就是空间 - 时间推理,AI 要理解物体、人和环境如何随着时间变化。

这正是今天很多 AI 系统的短板。

一个模型可以描述画面里有桌子、门、椅子,却未必不知道自己往前走会撞到桌子,左转能绕过去,门把手需要先转动才能打开。

对机器人来说,这个差别非常关键。要让机器人更可靠,就需要它具备对环境变化的预测能力。

人形机器人、无人机、自动驾驶仿真系统,本质上都可以被抽象成 " 观察—判断—动作 " 的过程。游戏也是如此。玩家通过屏幕观察环境,通过键盘、鼠标、手柄发出动作。两者的形式不同,但底层结构接近。

General Intuition 也已经开始尝试商业化。公开报道提到,公司已有一些来自游戏、仿真和机器人方向的客户,并计划扩大 API 可用范围。

General Intuition 想做底层模型供应商。就像 OpenAI 和 Anthropic 提供大语言模型能力,让别人基于它们开发应用;General Intuition 希望提供行动模型能力,让游戏公司、机器人公司、仿真公司基于它开发产品。

AI 行业三大新趋势

General Intuition 这轮融资反映了 AI 创业公司的新竞争逻辑。

第一,数据重新变成核心资产。

大语言模型时代,互联网文本、代码、图片、视频都被大量使用。越往后,公开数据越不够用,优质、私有、带标签的数据越来越贵。General Intuition 的特殊之处在于,它的数据不是简单 " 可观看 ",而是 " 可学习动作 "。

玩家每一次按键,都是一个动作标签。玩家每一次成功或失败,都是一个训练信号。对模型来说,这比只有画面的视频更有价值。

第二,算力仍然是最大成本。

GamesBeat 报道提到,Pim de Witte 谈到融资用途时直接说,GPU 很贵。General Intuition 计划把大量资金用于扩大算力,并与 CoreWeave 有合作安排。对前沿模型公司来说,融资往往不是为了慢慢花,而是为了锁定算力窗口。

第三,AI 开始向物理世界延伸。

如果说 ChatGPT 代表 AI 进入知识工作,那么 General Intuition 这类公司代表 AI 试图进入行动世界。

General Intuition 的技术演示虽然引人注目,但还不能简单理解为商业化已经成熟。

游戏到仿真,再到真实世界的大规模迁移,还没有被完全证明。真实世界数据获取慢、成本高、风险大,仍然是整个行业的难题。General Intuition 的赌注,是用游戏数据作为更便宜、更可扩展的预训练入口,然后再用少量真实数据做适配。

这个判断能否成立,还需要时间验证。

General Intuition 也在试图处理另一个敏感问题:AI 与游戏行业、劳动力、军事应用的关系。

游戏行业对 AI 一直很警惕。很多开发者担心 AI 会替代美术、设计、编剧和程序岗位。General Intuition 公开表示,不做替代游戏开发者、设计师或艺术家的技术。

它还推出了 Nerve 平台,让玩家通过数据标注、远程操作等任务获得收入。这个安排既是数据飞轮,也是对游戏社区的一种安抚。

在军事应用上,Pim de Witte 也划出边界。他表示不希望公司的智能体被用于伤害人类,但愿意用于搜索救援。

这一点和硅谷近年越来越积极拥抱国防科技的气氛并不完全一致,也让 General Intuition 有了更鲜明的公司性格。

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容