关于ZAKER 合作
虎嗅APP 4小时前

梁文锋,坐不住了

DeepSeek 被 " 捧杀 " 了

出品|虎嗅科技组

作者|宋思杭

编辑|苗正卿

头图|视觉中国

今天准备融资的梁文锋,已经不是一年前的那个梁文锋了。

4 月 17 日晚,据悉,DeepSeek(深度求索)正以约 100 亿美元估值寻求新一轮融资,规模约 3 亿美元。而就在一年前,梁文锋还明确拒绝过 VC 投资,并对外表示 "DeepSeek 暂无融资计划 "。对此,虎嗅向 DeepSeek 方面发送邮件进行核实,截至发稿未获回复。

" 我现在还不清楚梁是否真的开始找 VC 了。" 华映资本海外合伙人邱谆告诉虎嗅。邱谆常年往返于硅谷和国内,并长期关注 AI 与具身智能领域。

严格意义上,DeepSeek 并不属于华映在海外的直接项目,但 VC 的目光几乎都聚焦在 DeepSeek 身上。邱谆非常清楚地知道 DeepSeek 正在面临的困境,但同时他也告诉我," 这不代表我们不会投他。"

短短一年,梁文锋的态度发生 360 度反转。

4 月 19 日,社交媒体上又开始流传另一种说法:过去一年里,梁文锋曾先后见过马化腾与雷军,讨论融资的可能性。虽然真假尚未完全坐实,但传递出的信号已经非常明显了。对此,虎嗅也向腾讯方面求证,截至发稿,尚未得到回复。

那么问题来了,为什么时隔一年,这个一直以克制、低调著称的创始人,会从 " 拒绝融资 " 的态度,转变为主动接触资本?这中间究竟发生了什么?在笔者看来,这并不只是态度变化,更像是某种外部约束开始显性化。

一年前的梁文锋,几乎没有对手。架构与算法层面的连续突破,让 DeepSeek 一度被视为中国大模型体系中少数具备 " 自洽能力 " 的玩家之一,也在一定程度上加速了传统企业拥抱 AI 的进程。

但在某种程度上,也正是由于他过去突出的成绩,一时间被上百家国内外媒体称赞后,梁文锋几乎是被 " 捧杀 " 了。

过去一年,围绕 DeepSeek 的叙事开始出现裂缝。一方面,关于 V4 的发布时间,多次被外媒提前 " 预告 ",却始终未能如期落地;另一方面,在这些报道中,延迟原因也被直接指向一个更现实的问题,即摆脱英伟达体系所带来的代价。

然而,节奏开始变慢,外部预期却没有下降。

同样是在过去这一年中,团队层面也出现波动:包括参与代码研究的郭达雅、LLM 核心作者王炳宣、OCR 核心作者魏浩然在内的多位关键人才相继离开。

从外部视角看,这家曾被寄予厚望的公司,似乎遇到难题了。

而就在这些复杂信号传出之后,融资的消息出现了。如果把上述这些故事线连接到一起,一个很显而易见的答案是,梁文锋是被逼着走到今天的。

那么,我们先做一个假设,如果梁文锋真的去 VC 寻求帮助,VC 们会救他吗?

我得到的答案是肯定的。

被 " 捧杀 " 的 DeepSeek

DeepSeek 被 " 捧杀 " 了:它最被赞赏的能力,正在成为最难调整的部分。

回看 2025 年春节,那个 " 年 " 是属于 DeepSeek 的。

R1 发布之后,这家公司迅速被推到一个极高的位置:极致性价比、算法创新、国产替代路径等等。在一系列叙事叠加之下,DeepSeek 也被推到了一个被人仰望的高度。

彼时,外界的共识是,DeepSeek 在做的不仅是大模型,而是重写一套更便宜的 AI 基础设施。

但一年之后,这套叙事开始出现裂缝。

原本被认为会在 2026 年春节前后发布的新一代模型,却迟迟未能落地。外界几乎一致认为,关键卡点在于从依赖英伟达到摆脱这种依赖,这个过程很不顺利。

但 DeepSeek 曾经的优势,恰恰在于对英伟达强绑定。

与多数依赖规模堆叠的大模型不同,DeepSeek 是从 " 效率 " 入手,通过一系列算法与工程优化,实现了接近 SOTA 水平的性能,同时大幅压低成本。例如,其提出的 GRPO 架构,本质上是对训练与推理效率的再设计。

但这种效率,并不是凭空出现的。一方面,在算力上,创始人梁文锋早年量化交易的积累,使其拥有远超一般创业公司的英伟达 GPU 资源;另一方面,在数据上,DeepSeek 大量依赖对一流模型的蒸馏结果。

而真正关键的一步,在于底层工程。DeepSeek 通过直接优化 PTX 编程,对 GPU 执行层进行改写,从而实现了对 AI 算力基础设施的系统性重构。

对此,华映资本海外合伙人邱谆对虎嗅解释道:" 正是这一步,才让 DeepSeek 的‘性价比’能够实现。"

而问题也出在这里。PTX 本质上是英伟达 CUDA 体系中的中间语言,是其生态的核心接口之一。这意味着,DeepSeek 虽然在算法层实现了创新,但在基础设施层,却是高度绑定英伟达体系的。

也就是说,一旦尝试切换算力路径,例如转向国产芯片,问题就不再是 " 适配 ",而是 " 重写 "。

目前,大多数国产芯片厂商提供的是对 CUDA 生态的兼容方案,但对于已经深入 PTX 层优化的 DeepSeek 而言,这种兼容并不成立。底层代码、调度逻辑乃至整体工程体系,都需要重构。

换句话说,它的优势越深,迁移成本就越高。

这也解释了过去一年里的一些变化:模型节奏放缓、组织层面出现波动,以及部分核心人才的离开。从外部看,这些是现象,但背后指向的问题是:DeepSeek 正在尝试摆脱一条曾经让它领先的路径。

这条路径,甚至让 DeepSeek 无法有机会与国内一流模型站在同一梯队。

邱谆是一位常年住在硅谷的投资人。他告诉虎嗅,包括 OpenAI 在内的公司,并不会在底层过度依赖 PTX 优化,其原因是,他们不希望被单一算力体系锁死。国内互联网厂商亦是如此,他们不会将自己赖以生存的业务都押注在英伟达算力体系之上的。

但 DeepSeek 已经走得太深了。

在过去一年,DeepSeek 正在重写自己的底层代码,但这对他们来说,几乎是从 0 开始。

VC 一直在等梁文锋

于是,才有了 DeepSeek 寻求融资的故事。

一位头部 VC 投资人告诉虎嗅," 融资并不会改变什么 "。

原因已经很清楚了。从技术的角度来讲,这一切都是不可逆转的。尽管 DeepSeek 重写底层代码,试图适配国产芯片,性能也会大打折扣。

然而,从资本层面来看,这就是另一个故事了。" 虽然我很清楚 DeepSeek 现在面临的问题,但这并不影响很多 VC 抢他们 "。邱谆对虎嗅说道。

从大模型投资周期的角度来看,DeepSeek 早就错过了这一风口。但即便这家公司是从 0 开始,即便已经错过风口,都不会影响 VC 入局。

"VC 向来都是看人,而且 VC 本质上是一种‘冲动消费’。" 邱谆告诉我。

不过,梁文锋的想法,依然阴晴不定。根据目前已上市的大模型公司来计算估值,DeepSeek 的目标估值 100 亿美元并不高,甚至低于智谱、MiniMax 和 Kimi 任意一家。

但还有一种可能是,如果按照梁文锋从去年不愿意融资到今年开放融资的想法来推测,也许是梁文锋本人并不愿意释放过多股份。

从这一角度来看,DeepSeek 是否会融资,不确定性依然很高。

如果,梁文锋的目标是腾讯,也许融资后,对 DeepSeek 而言并不会发生太大变化,至少不会 " 伤筋动骨 ";但倘若,他的目标是所有 VC,那么也许 DeepSeek 会变成一家商业化公司,而这似乎并不符合这家公司的基因。

DeepSeek 会坠入 " 凡间 " 吗?

坠入 " 凡间 ",就意味着 DeepSeek 要站在和 Kimi、MiniMax、智谱、阶跃星辰一样的位置,成为新的 " 基模五强 "。

过去一年,DeepSeek 之所以被反复讨论,并不只是因为模型能力本身,而是因为它看起来 " 像一个例外 "。

它用更少的钱,做出了接近甚至逼近 SOTA 的模型;它拒绝融资,在一轮资本狂热中保持克制;它强调效率,而不是规模。

这些都可以证明,DeepSeek 从来没有走 " 既定路线 "。

但现在,这个 " 例外 " 正在变得越来越难以维持。

但也许,梁文锋是想成为 " 凡人 " 的。因为就算是按照 " 既定路线 " 来判断这家公司,他也有着自己的独特优势:

首先,它是一家能做出创新的公司,这一点就已经非常难得;第二,DeepSeek 并不缺钱,他寻求外界帮助,也许是想释放出另一种信号,甚至是身份上的转变。

从这种角度来看,融资意味着重新选择一条路径。

但如果,DeepSeek 真的变成一家商业化公司,他就需要考虑一个他从前并不需要过分考虑的事情:它的模型能力如何转化为收入?

当然,DeepSeek 可以用于梁文锋自己的幻方量化里,从而助力其他业务产生收入。但如果这样,DeepSeek 还会是一家传统意义上的大模型公司吗?

似乎,DeepSeek 正站在一个十字路口上。

相关标签

相关阅读

最新评论

没有更多评论了
科技频道

科技频道

科技改变世界

订阅

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容