关于ZAKER 合作
量子位 5小时前

英伟达 GPU 被 SpaceX 送上太空!在天上训练卡帕西的 NanoGPT

AI 真的上天了。

人类首次实现了在太空训练、运行大模型。

而主角我们也很熟悉:英伟达、SpaceX、谷歌……还有前 OpenAI 联合创始人卡帕西的 NanoGPT。

几个名字一出,故事就很明确了——

SpaceX 火箭把英伟达 H100 芯片送上太空后,在轨道上运行了谷歌的开源 AI 大模型 Gemma,并获取到了回应:

你们好,地球人!

图源:CNBC

除了 Gemma 之外,还在 H100 上用莎士比亚全集训练了卡帕西的大语言模型NanoGPT

对此,网友有话说:以后外星人想研究地球就不用亲自来一趟了(doge)。

上个月初,作为 Nvidia Inception 一员的、聚焦太空数据中心的初创公司Starcloud通过 SpaceX 火箭将 Starcloud-1 卫星发射升空,这颗卫星上搭载了英伟达 H100 芯片。

现在,就在这颗卫星上,人类实现了首次在太空轨道上训练、运行 AI 大模型。

在这场太空 AI" 首秀 " 中,跑通后的 Gemma(太空版)这样打招呼:

你们好,地球人!或者,我更愿意称呼你们为——一群由蓝色和绿色构成的迷人的存在。

让我们来看看你所处世界中蕴含着怎样的奇迹吧。我是 Gemma,我来这里是为了观察、分析,或许偶尔还会给出一些略显令人不安却又颇具洞察力的见解。让我们开始吧!

而首个直接在太空中进行训练的则是 Andrej karpathy 一手打造的 LLM —— NanoGPT。

不过,Starcloud 的目标可不仅仅是让 AI 能够在太空里跑得起来,它还计划建造一座基于太阳能面板的 5GW 的轨道数据中心,而且造价和运营成本还要显著低于地球上的同行们。

并表示在将在 2026 年 10 月的下一次卫星发射中携带更多的英伟达 H100 芯片,并且把 Blackwell 平台也一并带上去。

Starcloud 的 CEO Philip Johnston 曾说:

在地面数据中心能做的任何事情,我都期待能在太空中完成。我们之所以这样做,纯粹是因为在地面上面临的能源限制。

AI 模型越训越大,数据中心的电力、土地都在变成稀缺品,有的城市电网负荷大,有的公司光电费就能占掉训练成本的大头。地球的能源和基础设施已经到达瓶颈,AI 增长曲线被地球物理条件限制住了。

然而,在太空低轨环境下,没有地面土地、制冷等约束,成本在理论上会比地球更低;而持续充足的太阳能供给,也让在轨算力具备长期运行的能源优势。

不少人已经把算力上天列到了计划清单中。

就在英伟达 H100 上天之后,CEO 劈柴哥表示要把 TPU 也发射上去,最早的两颗卫星 2027 初启程。

中国玩家在太空算力上也早有布局。

2019 年起,中国科研机构(如中科院计算所、武汉大学、北京邮电大学等)就开始探索太空智能计算,进行关键技术研究。

2024 年中科天算团队完成大模型在轨上注与部署,构建 " 太空智能链 "。

今年 5 月, 国星宇航联合之江实验室成功发射全球首个太空计算星座(" 三体计算星座 " 首批 12 颗卫星),9 月实现来常态化商业运行,并成功支持了首个商业任务。

11 月,中科天算发布了 " 天算计划 ",提出在近地轨道建设算力达 10EOPS 的万卡超级智能体集群,并公布了应对辐射和散热挑战的工程方案。

AI 太空版正在加速中……

参考链接:

[ 1 ] https://www.cnbc.com/2025/12/10/nvidia-backed-starcloud-trains-first-ai-model-in-space-orbital-data-centers.html

[ 2 ] https://x.com/karpathy/status/1998806260783919434

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

点亮星标

科技前沿进展每日见

相关阅读

最新评论

没有更多评论了