关于ZAKER 合作
钛媒体 25分钟前

DeepSeek 首次融资,AGI 理想向资本低头?

据《The Information》援引知情人士报道,长期以 " 不融资 " 闻名的 AI 明星公司 DeepSeek,正在与投资者洽谈,计划以至少 100 亿美元的估值筹集不少于 3 亿美元资金。这是这家由中国量化巨头幻方量化孵化的公司成立以来首次启动对外融资,标志着其长达数年的 " 自我供血 " 模式将画上句号,也标志着 DeepSeek 从技术 " 理想主义 " 走向 " 现实主义 "。

回顾 DeepSeek 的发展轨迹,这种转变显得尤为意味深长。在过去两年中,当整个中国 AI 行业都在疯狂融资、扩张、讲生态故事时,DeepSeek 反而在做一种刻意的收缩——不对外发声,不频繁发产品,不参与大厂叙事,甚至对资本保持距离。创始人梁文锋从公司成立第一天就划了一条清晰的红线:不接受外部融资,不稀释股权,不被任何人的商业化时间表绑架。他想打造的更像一个纯粹的研究机构,追逐 AGI(通用人工智能)、坚持开源、让技术本身说话。

理想主义者的现实主义转身

要理解 DeepSeek 为何在此时融资,首先得回顾它为何长期拒绝融资。

DeepSeek 由量化对冲基金幻方量化的创始人梁文锋于 2023 年创立。在此之前,幻方用多年的量化交易利润为 DeepSeek 提供了持续的资金 " 输血 "。公司股权结构极为集中,梁文锋直接和间接持有 84.29% 的股份,并拥有几乎 100% 的表决权。

这种 " 不差钱 " 的底气,让梁文锋得以坚守一种近乎理想主义的发展哲学:拒绝资本的短视干扰,专注打磨基础模型,追求实现 AGI 的技术上限。

联想创投高级合伙人宋春雨曾透露,自己早在 2024 年 2 月就与梁文锋深入交流,但对方明确表示不融资。" 梁文锋对商业化不感兴趣,他专注打磨基础模型,确保每一代模型都保持领先。" 另有报道称,梁文锋曾拒绝来自腾讯和阿里巴巴等科技巨头的合作机会,担心外部投资者会干预公司决策。

这一定位让 DeepSeek 在早期创业公司中显得格外另类。当其他大模型创业公司在 2023-2024 年疯狂融资、高调亮相时,DeepSeek 像一个隐士般潜心研发,直至 V3 和 R1 的横空出世才让世界注意到它的存在。

然而,这种 " 不缺钱 " 的自信在 2026 年初出现了明显裂缝。最直接的信号来自人才流失。2025 年底至 2026 年初,DeepSeek 多名核心研发骨干相继出走:V3 架构关键开发者罗福莉转投小米接手 MiMo 大模型团队;第一代大语言模型核心作者王炳宣去了腾讯;多模态方向核心研究员阮翀加入元戎启行;OCR 系列核心作者魏浩然也在今年春节前后离开。

更致命的是期权问题。DeepSeek 从未融资,没有市场化的估值锚点。公司给核心成员的股权承诺,拿到手里无法换算成真金白银。大厂的期权有行权价、有内部回购机制、有 IPO 预期。外界只知道 DeepSeek 很值钱,但到底值多少,没有人能说清,员工更不知道。

而这些原因似乎也预示着 DeepSeek 的融资只是迟早的事。

多重压力下的必然选择

DeepSeek 的融资转折并非单一因素驱动,而是多重压力交织下的必然结果。这些压力来自技术迭代、算力需求、市场竞争和战略节奏等多个维度,共同构成了梁文锋不得不面对的现实困境。

技术迭代的沉重包袱是首要压力。下一代旗舰模型 V4 的发布一再推迟,原本定在春节前后发布,推到 2 月,再推到 3 月,目前的口径是 4 月下旬。从公开信息来看,延期背后至少有三层原因交织:技术路线本身发生质变、身份包袱压力、国产芯片深度适配的挑战。V4 要做的已经不再是一个刷 benchmark 的基础模型,而是万亿参数 MoE 架构、原生多模态、百万 token 上下文、全新的 Engram 条件记忆机制的系统级工程,训练验证复杂度陡然上了一个台阶。

更深层的压力来自身份包袱。DeepSeek 立身靠的是 " 十分之一成本做到顶级 " 这个故事。V4 如果只是性能微增却推高了推理成本,支撑估值和声誉的故事就会出现裂痕。某种程度上,一个不够惊艳的 V4,反而不如不发。

此外,国产芯片的深度适配成为独立巨型工程。多方信源在 4 月初披露,V4 将全面运行在华为昇腾 950PR 芯片上,有望成为首个完全跑在国产算力上的旗舰大模型。战略价值极高,但这本身直接吃掉了大量研发带宽。

到 2026 年 4 月,DeepSeek 已有 15 个月没有大版本更新。而这期间,OpenAI 迭代四五轮,Anthropic 连推 Claude 4.5/4.6/4.7,国内同行如智谱、月之暗面、字节也在应用层狂飙突进。所有人都在加速,只有 DeepSeek 静悄悄。

梁文锋本人也曾坦言国产 AI 模型训练效率的差距:" 我们估计,国内最好的水平和国外最好的相比,模型结构和训练动力学上可能有一倍的差距,光这一点我们要消耗两倍的算力才能达到同样效果。另外数据效率上可能也有一倍差距,也就是我们要消耗两倍的训练数据和算力,才能达到同样的效果。合起来就要多消耗 4 倍算力。" 这种客观存在的技术差距,使得 DeepSeek 在追求技术领先的同时,必须面对更高的算力成本。

值得注意的是,在 R1 爆红后,DeepSeek 的用户量和并发请求量呈指数级增长,对算力基础设施的需求急剧攀升。2026 年初,DeepSeek 甚至经历了一场大规模服务中断,网页端与 App 全面卡顿,"DeepSeek 崩了 " 相关话题迅速冲上多个平台热搜。

与此同时,巨头们正在以 " 千亿级 " 规模加码算力基建。阿里巴巴宣布未来三年投入 3800 亿元建设云和 AI 硬件基础设施;字节跳动 2025 年资本开支计划高达 1500 亿元,同比大增 88%。相比之下,靠母公司幻方量化的资金支撑已明显力不从心。

此外,前文提到的核心团队频频被大厂高薪挖走,也造成了 DeepSeek 不得不获取更多的钱,来留住现有的团队,保持技术竞争力,毕竟在这个 AI 人才稀缺的当下,大厂对 AI 人才的需求与现有的人才供应差距很大。如果没有足够有吸引力的 " 未来 "(包括薪资、股权等),是留不住人才的,这点从过去两年 AI 人才市场的流动趋势已经可以看出。

融资后的 DeepSeek" 路在何方 "?

若 DeepSeek 成功获得外部融资,这笔资金将为其在技术研发、市场拓展和商业变现等多个关键领域注入强大动力,进而对整个 AI 行业格局产生深远影响。然而,融资只是开始,DeepSeek 面临的挑战依然严峻。

技术研发的深度与广度拓展将是融资后的首要方向。DeepSeek 有望利用融资资金进一步加大对人工智能技术的研发投入。一方面,公司可能会持续优化现有模型,不断提升其性能和智能化水平。另一方面,DeepSeek 可能会加大对前沿技术的研究探索,如具身智能、AI Agent 生态等领域。

这个过程中,其 V4 模型发布后,业界的反响将成为关键考验。据报道,DeepSeek V4 大模型将彻底重构技术架构,核心引入 mHC(多路残差混合连接)与 Engram(AI 记忆模块)两项黑科技,聚焦代码生成、推理效率与边缘部署三大能力,技术路径从 " 堆参数 " 转向 " 双轴稀疏 + 记忆 - 计算分离 "。市场预计,DeepSeek 新模型训练成本再降 50%,若实现完全开源或将推动行业 API 价格减少 60%。这将是 DeepSeek 证明自己依然保持技术领先优势的重要机会。

市场拓展的全球化布局是第二战略重点。凭借充足的资金,DeepSeek 将有能力在全球范围内积极拓展市场,提升品牌知名度和市场份额。在国内市场,DeepSeek 可能会进一步加强与各行业企业的合作,深入挖掘行业需求,为金融、医疗、教育、制造业等领域提供更加定制化的人工智能解决方案。实际上,DeepSeek 已经在多个行业展现出应用潜力:广汽集团将自主研发的 ADiGO SENSE 端云一体大模型与 DeepSeek-R1 完成深度融合;重庆农商行企业微信上线基于 DeepSeek 模型的智能助手进行风险评估和欺诈监测;智云健康将 DeepSeek-R1 模型接入自研医疗人工智能系统 " 智云大脑 ";网易有道借助 DeepSeek-R1 优化个性化答疑功能;中控技术实现了工业 APP 的智能构建。

在国际市场,DeepSeek 可能会借鉴国际科技巨头的市场拓展经验,采取本地化策略,根据不同国家和地区的市场特点和用户需求,推出针对性的产品和服务。当然,这个过程中还需要面对地缘政治的考验。

此外,融资后,公司将有更多资源用于探索多元化的商业变现模式,实现技术价值的最大化。除了现有的 API 调用收费、私有化部署等商业模式外,DeepSeek 可能会加强技术授权业务,将其先进的人工智能技术授权给其他企业使用。

然而,商业化转型并非易事。梁文锋曾明确表示担忧外部干预可能让 DeepSeek 变成 " 另一个商业机器 ",而非技术革新的先锋。高估值融资后,投资人可能要求快速增长或上市,迫使 DeepSeek 牺牲开源模式或长期研发计划。如何在保持技术理想与满足商业回报之间找到平衡,将是 DeepSeek 管理层需要解决的核心矛盾。

DeepSeek 的转折,从来不是梁文锋一个人的 " 理想妥协 ",而是整个国产 AI 行业的缩影。在 AI 这场残酷的长期竞赛中,技术理想主义需要商业现实的支撑,独立自主需要开放合作的补充,前沿探索需要生态建设的协同。DeepSeek 的融资之路,正是这种复杂平衡的开始。

(文|Leo 张 ToB 杂谈,作者|张申宇,编辑丨盖虹达)

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容