关于ZAKER 合作
钛媒体 16分钟前

AI 创业圈又冲出一个 288 亿独角兽

文 | 新质动能,作者|沐风,编辑|时楠

AI 创业圈里,又冲出一个估值 288 亿的独角兽。

这家公司背后的掌舵人——乔琳,本硕均毕业于复旦大学计算机系,资历硬到能在硅谷掀起风浪。

她的投资人阵容堪称豪华:有红杉、Benchmark 这样的顶级老牌风投,也有一票手握核心算力的产业巨头。

而最炸裂的,是那两位名字——英伟达和 AMD。

没错,黄仁勋和苏姿丰,这对在芯片战场互不相让的对手,竟罕见地坐到同一张牌桌上,为同一个创业者押下重注。

这就让人忍不住想问:乔琳,这位复旦才女,以及她创立的名字有点拗口的 Fireworks AI,究竟有何底气,让芯片圈的 " 教父 " 和 " 女王 " 同时放下刀剑,掏出支票?

复旦才女硅谷进阶

要看懂 Fireworks AI,必须先看懂它的创始人,乔琳。

这位姐的履历,堪称一部学霸和技术大牛的进化史。复旦本硕连读,加州大学圣巴巴拉分校博士,先后在 IBM、LinkedIn 当技术高管。创业前,她最重要的一站,是在 Meta(当年的 Facebook)。

在 Meta 任职期间,她领导了超过 300 人的工程团队,把 PyTorch 从一个科研圈的小众工具,打造成支撑全球开发者生态的行业标杆。她主导的改造,不只是把它跑起来,更是让它能在 Meta 的数据中心、移动端、以及 AR/VR 设备上高效运行。

简单来说,PyTorch 就是今天无数 AI 模型的 " 地基 "。而乔琳,就是当年那个最核心的 " 包工头 " 之一。

这段经历,让她悟透了一个道理:PyTorch 之所以能干翻几十个竞争对手,关键就在于它的设计哲学——把复杂留给团队,把简单带给用户。

开发者用起来,几行代码就能调用强大的功能,极其丝滑。但他们不知道的是,背后是几百个顶级工程师,在处理着天文数字般的复杂技术。

2022 年,她拉上六位 PyTorch 老战友和一位前谷歌 AI 专家,在加州雷德伍德创立了 Fireworks AI。这个团队,几乎可以说是 AI 基础设施的 " 梦之队 ":有人擅长分布式推理引擎,有人深耕 GPU 算力优化,有人对大模型微调了如指掌。

Fireworks AI 创始团队,图源:Fireworks AI 官网

她的目标很明确:在 AI 这波淘金热里,不当那个挖金矿的,而是当那个在旁边卖水、卖铲子的。

现在搞 AI 的创业公司,遍地都是。但他们都有个共同的痛点:想用开源大模型,但自己买 GPU 服务器太贵,养算法工程师太难,部署和优化更是要命。

怎么办?乔琳的公司,就像一个 "AI 算力中央厨房 "。

他们租来一大堆英伟达的服务器,把市面上最火的开源大模型,比如 Llama、DeepSeek,都提前在上面装好、优化好。然后,创业公司直接通过 API 接口来调用就行,按流量付费。

你不用管后厨有多兵荒马乱,直接点菜就行。Fireworks AI,就是要把这种极致的 " 简单 ",卖给所有想用 AI 的人。

Fireworks AI 的秘密武器

如果只是当个中介,租服务器再转租出去,那 Fireworks AI 不值 288 个亿。

他们真正的 " 秘密武器 ",是能让 AI 模型跑得更快、更省钱的底层优化技术。说白了,他们不只是 " 中央厨房 ",还是自带 " 米其林三星 " 技术的大厨。

光说不练假把式。我们来看看他们的客户,AI 编程独角兽 Cursor,是怎么被他们 " 带飞 " 的。

Cursor 是个给程序员用的智能编程工具。但程序员有个大麻烦:想让 AI 改一大段代码,比如几百行,用 GPT-4 这种通用模型,经常又慢又错,急死个人。

为了解决这个问题,Cursor 自己训练了一个专门用来 " 改代码 " 的新模型。但光有模型还不够,还得跑得快。

这时候,Fireworks AI 出手了。他们用了两招,给 Cursor 的模型装上了 " 涡轮增压 "。

第一招,叫 " 量化技术 "。

这玩意儿说起来复杂,其实很简单。就像把一部 4K 高清电影,压缩成能在你手机上流畅播放的短视频,画质没差多少,但文件小了好几倍,播放起来也快多了。

Fireworks AI 就是用类似的技术,在不牺牲太多准确性的前提下,让 AI 模型的计算效率大幅提升。

第二招,叫 " 推测执行 "。

普通 AI 写代码,是一个字一个字往外蹦。但 Fireworks 的技术,能让 AI" 脑补 ",一次性猜出后面好几个词,然后回头快速验证。这样一来,速度直接起飞。

效果有多炸裂?用了 Fireworks AI 的技术后,Cursor 的模型速度飙到了每秒生成约 1000 个 token,比普通推理快了 13 倍,比之前用 GPT-4 也快了 9 倍。

更狠的是,Fireworks AI 靠自研的推理引擎和优化工具,把算力榨到极致。比如他们的 Fire Attention 技术,能让推理速度飙升、资源消耗下降,直接帮客户省下一大笔钱。

最终,程序员改几百行代码,几秒钟就能出结果。这种效率的提升,就是 Fireworks AI 最值钱的地方。

黄仁勋双重身份

技术牛,商业模式清晰,客户也都是 AI 圈的当红炸子鸡。Fireworks AI 自然成了资本的宠儿。

他们的投资人名单,星光熠熠:红杉、Benchmark、AMD、英伟达……

但在这其中,英伟达的角色,最值得玩味。

作为 A 轮的投资方,英伟达不仅给了钱,还和 Fireworks AI 有深度技术合作,互为客户。看起来,这是一段 " 伯乐与千里马 " 的佳话。

但,你可别忘了,这个人是黄仁勋。黄仁勋的投资,从来都不是纯洁的友谊。

就在今年 3- 月,英伟达收购了 Fireworks AI 的竞争对手 Lepton,然后强势推出了自己的 GPU 云服务市场,直接杀进了 Fireworks AI 的核心业务领域。

在医疗健康领域,英伟达也投资多家公司,为 AI 药物研发提供强大的算力支持。不仅如此,在量子计算等前沿领域,英伟达也与谷歌、甲骨文等巨头强强联手,共同开发量子芯片,并为企业客户提供混合量子计算服务的测试和开发平台。

一边给你递上支票,一边可能已经在磨刀,准备随时收割你的业务。 这,就是科技巨头的生存法则。乔琳自己,对此也看得很清楚。

乔琳在最近一次访谈中透露,任何有利可图的市场,英伟达都虎视眈眈,准备加入竞争,打破现有格局。她直言不讳地指出,垄断并非市场所乐见,竞争是必然趋势,本质上这是一个经济问题。

至于这场竞争何时打响?乔琳表示,应该很快了。

这种合作与竞争并存的微妙关系,引发了业界对于英伟达未来动向的关注,尤其是其是否会收购 Fireworks AI,更成为一个值得探讨的热点话题。

而这次传出的 40 亿美元估值,既是市场对 Fireworks AI 技术和商业模式的认可,也是一场与时间的赛跑。他们必须在英伟达这个 " 巨无霸 " 亲自下场收割之前,尽快做大规模,建立自己的护城河。

相关标签

觉得文章不错,微信扫描分享好友

扫码分享