梁文锋终于低头，DeepSeek 首轮融资曝光

梁文锋不是神，向现实低头不丢人。

出品 | 新行情作者 | 刘峰

这两天，投资圈彻底炸了。

有知情人士爆料，AI 明星公司 DeepSeek 正式启动成立以来的首次外部融资——目标估值不低于 100 亿美元，计划募集至少 3 亿美元资金。

而众所周知，就在一年前梁文锋还明确拒绝过 VC 投资，并对外表示 "DeepSeek 暂无融资计划 "。

当时，有知名投资者找了三拨人想约见，被拒绝；甚至与 DeepSeek 北京办公室同楼办公的百度风投也没能投进去。

那个曾经把所有投资人挡在门外的梁文锋，为什么突然要钱了？

" 从不融资 " 已是过去

消息一出，讨论立刻分成了两派。

一种说，完了，连 DeepSeek 都顶不住 AI 烧钱的压力；另一种说，AI 圈要变天了，梁文锋这是要憋个大的。

但如果你只看到 " 缺钱 " 两个字，就把梁文锋和这件事看小了。

图源：知乎

据悉，2023 年 7 月，当 DeepSeek 正式成立之时，梁文锋从第一天就给这家公司划了一条清晰的红线：不接受外部融资，不稀释股权，不被任何人的商业化时间表绑架。

他确实有这个底气。梁文锋是幻方量化的创始人，而幻方是国内顶级的量化对冲基金，管理规模超 700 亿元，2025 年平均收益率高达 56.6%。

早在 2019 年，他就花 2 亿元自研了深度学习训练平台萤火一号，两年后又砸 10 亿元建萤火二号，大批采购英伟达 A100，把幻方做成了国内屈指可数的万卡集群公司。

有量化基金从业者估算，仅 2025 年一年，幻方就为梁文锋带来了超过 7 亿美元的收入。

有钱、有卡、有人，这就是 DeepSeek 长期拒绝融资的底气。梁文锋说得也很直白：VC 都是帮 LP 管钱，都得赚钱，所以就谈不到一块去。

然而，在过去一年里，这个防火墙似乎被逐渐击穿了。

当下，AI 大模型的竞赛，已经到了决胜期或决胜期前夜。

3 月 31 日，OpenAI刚以 8520 亿美元的估值完成了 1220 亿美元的融资。Anthropic在 2 月以 3800 亿美元估值完成 300 亿美元融资。

国内同样在加速，智谱 AI已于 1 月登陆港股，IPO 前完成 8 轮融资、累计募资超 83 亿元。月之暗面 Kimi更是在短短数月内先后完成多轮融资，估值已突破 100 亿美元。

当身边的竞品都在用市场化手段绑定人才、储备算力，梁文锋还能坚持多久？

图源：X

半导体研究机构 SemiAnalysis 曾估算，DeepSeek 的服务器总资本支出接近 16 亿美元，其中 9 亿多直接和运行计算集群相关。而越往顶尖走，每往前追一步，边际成本就越高。

从 15 秒跑到 13 秒，多练练就行；但从 10 秒跑到 9 秒 9，每提升 0.1 秒，都要付出几倍的努力和成本。这不是靠一家量化基金的利润就能无限支撑的。

此外，不少人认为 DeepSeek 曾经的优势，在于对英伟达芯片的深度绑定和调教。

与多数依赖规模堆叠的大模型不同，DeepSeek 是从 " 效率 " 入手，通过一系列算法与工程优化，实现了接近 SOTA 水平的性能，同时大幅压低成本。

但这种效率，一方面建立在梁文锋早年量化交易积累的大量英伟达 GPU 资源之上，另一方面也深度依赖英伟达的 CUDA 生态。

一旦出现供应链限制，整个公司的研发、训练、推理都可能受到严重影响。而当前美国对高端芯片的出口管制持续收紧，英伟达最新一代 Blackwell 芯片的获取存在一定限制。

多重压力叠加之下，不是梁文锋想通了，是他不得不通。

DeepSeek V4 背后，梁文锋的野心彻底暴露

很多人盯着融资的数字，却忽略了这次事件里最影响行业格局的一件事：DeepSeek 即将发布的 V4 模型，正在全力从英伟达的 CUDA 生态向华为昇腾芯片迁移。

结合前面所说，V4 的技术野心，远超外界想象。

根据目前披露的信息，V4 的参数规模跃升至万亿级别。它采用 MoE 架构，总参数约 1 万亿，但每个 token 仅激活约 370 亿参数，推理成本几乎与 V3 持平——这个设计思路延续了 DeepSeek 一贯的效率优先哲学。

上下文窗口扩展到 100 万 token，并引入了一套名为 Engram 的条件记忆架构，实现超长上下文的恒定时间检索。据内部测试，在 100 万 token 长度下的信息召回率达到 97%，远超 V3 在 128K 上下文时的表现。

更重要的是，V4 将是 DeepSeek 首个原生多模态模型，支持文本、图像和视频生成。此前 DeepSeek 的模型一直以纯文本为主，而其他旗舰模型早已拥抱多模态。

据悉，该模型代码能力也被大幅强化，内部 benchmark 显示 SWE-bench 成绩超过 80%，HumanEval 达到 90%，据称 V4 能处理整个代码仓库级别的复杂 bug 修复。

此外，V4 预计将分两个版本发布：完整版超万亿参数，面向华为昇腾芯片；轻量版约 2000 亿参数，面向通用对话和 API 服务。

图源：抖音

当然，行业的关注点不会停留在模型本身。

DeepSeek V4 对华为昇腾算力生态的深度适配，大幅降低了对英伟达生态的依赖。这件事的意义之大，以至于英伟达创始人黄仁勋在近期采访中公开表达了关注。

外媒爆料，黄仁勋私下表示，" 如果有一天 DeepSeek 先在华为芯片上发布，那对我们来说将是一个可怕的结果 "。

当然，这条路并不好走。与英伟达 CUDA 生态的深度绑定，使得切换国产芯片需要 " 重写 " 大量核心代码，迁移成本高昂。

据多家行业媒体报道，DeepSeek 原计划今年 2 月发布 V4，但因工程问题多次推迟，团队正在投入大量精力进行适配迁移工作。这也是 DeepSeek 已有 15 个月没有大版本更新的重要原因之一。

然而，这件事一旦做成，意义将远远超出 DeepSeek 自身。

它将成为全球第一个不依赖英伟达的顶尖 AI 大模型，为中国 AI 产业链的自主可控提供一个重要的技术支点。

从这个角度看，梁文锋的融资，买的是算力，更是一个生态自主的机会。

融资的深层逻辑

那么，除了这些，融资的真正意义是什么？

首先，融资解决了期权定价的问题。

DeepSeek 此前一直没有进行大规模市场化融资，公司估值没有明确的市场标尺，团队成员手里的期权价值缺少清晰的参照。

这次融资，通过市场化方式给公司定了估值，本质上就是给团队搭建了合理的长期激励体系。这比给员工涨工资更重要——在 AI 这个高度依赖顶级人才的行业，没有市场化的激励机制，留人就是一句空话。

其次，融资为 V4 的研发和部署提供了弹药。

V4 要实现万亿参数、适配国产芯片、做到原生多模态，每一项都是烧钱的大工程。虽然幻方量化持续为 DeepSeek 供血，但 AI 大模型竞赛的本质已经变了——这不是接下来一两年可以结束的，未来三年有可能争出个分晓。

梁文锋这次启动融资，核心就是为了长期研发储备充足的算力弹药。

第三，融资开启了商业化的通道。

DeepSeek 的开源路线决定了它的商业化路径必须走差异化。闭源玩家的商业化路径更清晰，但 DeepSeek 必须通过 API 调用和企业定制来变现。

而企业级客户，尤其是政府客户和大型国企，选择 AI 供应商时，看的不是技术指标，而是资质和背景。

本轮融资如果引入国有资本，意味着 DeepSeek 可能获得政府 AI 项目的优先供应商资格；美元基金入场，则为国际化扩张铺平了资质道路。

但融资也带来了一个无法回避的问题：DeepSeek 正在从一家 " 例外 " 走向一家正常的商业公司。

过去 DeepSeek 最特殊的地方，恰恰在于它不像一家典型 AI 公司。它背后有幻方量化供血，梁文锋不急着融资，也不急着把公司推上估值、商业化和资本退出的流水线。

DeepSeek 对自己的定位，与其说是一家商业公司，不如说更像是一个完全独立于资本市场而运作的开源研究机构。

但今天的 AI 竞争已经不是单点模型能力的竞争了。

字节有豆包、有即梦，阿里和腾讯开始把世界模型推到台前，智谱、MiniMax 已经登陆港股。

如果只看 DeepSeek 至少 100 亿美元的估值，它当然还是一家很贵的 AI 公司。可放在今天的中国 AI 坐标系里，智谱、MiniMax 在港股高点的市值都曾突破 3000 亿港元，月之暗面最新估值已经达到了 180 亿美元。

DeepSeek 过去可以靠技术理想和开源声望行走江湖。但当行业从技术竞赛转向生态和商业化竞争，一家公司终究需要治理结构、估值体系、薪酬激励、商业化收入和长期预算。

研究理想可以继续存在，但公司终究要面对现实。

不是理想不好，是现实太贵。算力成本在涨，人才价格在涨，竞争对手的估值在涨——当所有生产要素都在涨价，技术理想主义本身也在涨价。

梁文锋用三年时间证明了一件事：用更少的钱可以做出很好的模型。但现在他需要证明另一件事：用市场化的方式，能不能让这家公司走得更远。

毕竟，AGI 不是靠理想就能抵达的。

点关注，跟主编交个朋友 ↓↓↓

商务合作请联系微信 / 电话：18576718939

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

梁文锋终于低头，DeepSeek 首轮融资曝光

宙世代

一起剪

相关阅读

航旅纵横APP各项功能已恢复正常：将逐一跟进异常订单

新塘牛仔 再闯世界

惊魂一刻：iPhone手机揣兜突然自燃 刚换了原装认证电池

《王者荣耀》农场偷菜改规则了：可偷4次 再也不看脸

日本本州东部附近海域地震

HBO出品的10大黄暴系列美剧，全程高能无尿点，看完直呼过瘾

和讯信息陈锦慧：国内油价迎2026年首次下调，油价降多少，还有空间吗？

王朔：我不是一个人，只不过室友不是人

藏在经典日剧里的魅力聊天指南

伊朗对米尔贾法里处以绞刑

5部顶级欧美剧，最高豆瓣评分9.8分！建议收藏

前几个月，我们发了啥

万亿级“大风口”，加速起飞！

Discount Tire员工免费修复客户漏气轮胎获赞

形态各异的机器人也能跳群舞？6G解锁具身智能群体协同

最新评论

企业资讯

热门推荐

企业资讯

新塘牛仔再闯世界

惊魂一刻：iPhone手机揣兜突然自燃刚换了原装认证电池

《王者荣耀》农场偷菜改规则了：可偷4次再也不看脸