
刚刚过去的几天,科技圈被 DeepSeek 的消息接连刷屏。
最新的消息是,DeepSeek 被传正启动成立以来的首次融资,目标金额高达 500 亿元(约 73.5 亿美元),投后估值高达 3500 亿元(约 515 亿美元)。
这一规模,将创下中国人工智能公司单轮融资的最高纪录。
DeepSeek 本次融资,创始人梁文锋将出资 200 亿元,占融资总额的 40%。
2026 年 4 月初,DeepSeek 被曝启动首轮融资,初始估值约 100 亿美元。紧随其后的消息不断,包括腾讯、阿里等参与洽谈,国家集成电路产业投资基金洽谈领投等。
从估值 100 亿美元到 515 亿美元,短短 21 天,暴涨超 4 倍。
备受关注的是,梁文锋曾公开表示 " 不融资、不上市,不商业化 "。如今,这一 " 三不 " 铁律为何被打破?DeepSeek 缺钱吗?
有分析人士称,AI 行业正在进入一个典型的 " 重资产阶段 ",训练大模型很烧钱。更为重要的是,人才竞争日趋激烈,DeepSeek 已有多位核心研发人员确认离职。
针对上述种种传闻及猜测等,DeepSeek 并未公开澄清。
DeepSeek 的融资事项引发科技界高度关注。
大模型公司 DeepSeek 成立于 2023 年 7 月,由幻方量化孵化,发展初期资金完全依靠幻方量化支持,未进行过任何外部股权融资。创始人梁文锋通过个人持股及关联实体控制 DeepSeek 84.29% 的股份。
梁文锋曾给 DeepSeek 立下 " 三不 " 规矩:不接受外部融资、不稀释股权、不被任何人的商业化时间表绑架。
2025 年 2 月,DeepSeek 被曝首次考虑外部融资,阿里巴巴、中国投资有限责任公司有意参与,目标估值 100 亿美元,融资可能超过 3 亿美元。
当时,DeepSeek 澄清,融资相关均为谣言,公司暂无外部融资计划,资金来自母公司幻方量化支持。
当时,阿里巴巴、360 集团等均称与 DeepSeek 无股权融资,仅技术合作。
2026 年 4 月初以来,关于 DeepSeek 的融资消息密集传播。
4 月初,DeepSeek 启动首轮融资,计划融资不少于 3 亿美元,初始估值约 100 亿美元。4 月 22 日,腾讯控股、阿里巴巴等参与洽谈,估值升至 200 亿美元。5 月 6 日,国家集成电路产业投资基金洽谈领投,估值达 450 亿美元。
5 月 8 日,DeepSeek 估值约 450 亿美元,国资背景投资方确认参与。
5 月 9 日,融资目标明确为 500 亿元,估值近 3500 亿元(约 515 亿美元),梁文锋个人出资 200 亿元,成为本轮融资中的最大投资者。国家集成电路产业投资基金等机构参与投资。
也有消息称阿里巴巴参与融资洽谈失败,还有消息称阿里巴巴、字节跳动等大厂并未参与洽谈投资。
这些消息真假难辨,外界难以甄别。
上述消息如果属实,那么,短短 21 天,DeepSeek 估值将从 100 亿美元迅猛飙升至 515 亿美元(3500 亿元人民币),堪称惊人。
针对上述消息,包括梁文锋出资 200 亿元参与认购,截至目前,DeepSeek 及梁文锋方面均未进行回应。
3500 亿元的估值,DeepSeek 将跻身中国 AI 独角兽第一阵营。
DeepSeek 和智谱、MiniMax、月之暗面被称为中国 AI 四小龙。已在港股上市的智谱、MiniMax,截至 5 月 8 日,市值分别为 4115 亿港元、2329 亿港元。月之暗面的公开估值也已经超过 200 亿美元。
这意味着中国 AI 四小龙估值合计已经超过万亿元。
为何撕掉不商业化标签
DeepSeek 为何突然打破自身铁律、撕掉不商业化的标签?
作为行业知名公司,DeepSeek 估值高达 3500 亿元,虽然短期内暴涨,但并不令人意外。
DeepSeek 已经拥有一定的全球开发者影响力和社区中不错的口碑。OpenAI 与 Anthropic 在技术报告中多次将 DeepSeek 列为重点跟踪对象。2025 年 9 月,DeepSeek 甚至登上了 Nature 封面。
DeepSeek 让市场看到了其模型能力和成本控制的想象空间。4 月 24 日,DeepSeek 公布 V4 预览版,并同步开源。V4 用了 1.6 万亿参数的混合专家架构,上下文窗口拉到百万 token 级别,在代码生成和长文档理解上进一步升级。
DeepSeek 还宣布,V4 将完全跑在华为昇腾 950PR 芯片上,训练框架从英伟达的 CUDA 切到了华为的 CANN。
这些优势及持续升级,让其高估值并不令人意外。
那么,一直声称不缺钱的 DeepSeek 为何要融资?
有报道给出了答案,给员工手中的股票期权定出一个清晰的价值,从而留住核心研究人员,避免被竞争对手挖墙脚。
公开信息显示,2025 年下半年以来,DeepSeek 至少流失了 5 名核心研发成员,覆盖基座模型、推理、OCR 和多模态四条核心技术线。
公开的名单显示,其中第一代大语言模型核心作者王炳宣去了腾讯,V2/V3 关键贡献者罗福莉被雷军以千万年薪挖至小米,R1 核心研究员郭达雅确认加入字节跳动 Seed 团队,OCR 核心作者魏浩然、多模态项目负责人阮翀也先后离职。
这些互联网大厂给予更高的薪酬包和已经定价的期权,更具吸引力。
此外,虽然有幻方量化做后盾,DeepSeek 是国内少数 " 不急着融资 " 的 AI 公司,梁文锋也曾公开表示,VC 的钱是负担,VC 都是帮 LP 管钱的,都得赚钱,但是现在,DeepSeek 可能也不会是 " 不缺钱 " 了。
有分析人士表示,AI 行业是个烧钱的行业,训练一个大模型,单次成本几千万美元起步。训练完了要推理部署,部署完了要持续迭代,每一步都要烧钱。DeepSeek 不断变强,相应的训练成本会更高。
在业内人士看来,大模型本质上是一个资源高度集中的行业,资金、人才、开发者生态都会向头部进一步集中。DeepSeek 撕掉不商业化的标签,是为了准备进入更大规模竞争阶段。
在外界看来,赚钱能力很强的幻方量化,虽然能为 DeepSeek 持续输血,保证其顺利前行,但梁文锋想要的不是活下去,而是要做头部企业。这就是梁文锋违背自己 " 诺言 " 的主要原因。