雷达财经出品 文 | 丁禹 编 | 孟帅
在 AI 巨头们全力厮杀的当下,昔日 " 特立独行 "、长期将外部资本 " 拒之门外 " 的 DeepSeek 也 " 缺钱 " 了?
据外媒 4 月 17 日消息,深度求索(DeepSeek)正就首次引入外部资本展开洽谈,希望充实资金储备,以便在研发顶尖人工智能模型的高成本竞争中占据更有利地位。
报道称,DeepSeek 计划募集不少于 3 亿美元资金(约合人民币 20 亿元),对应的公司估值至少为 100 亿美元(约人民币 682 亿元)。不过,这一估值远低于去年外媒给出的最高 1500 亿美元。
DeepSeek 传出融资消息之际,其人才外流现象也受到外界关注,近有被传字节高薪挖走的 95 后研究员郭达雅,更早之前还有出走小米的 "AI 才女 " 罗福莉、以及被腾讯挖走的 DeepSeek LLM 核心作者王炳宣等。
值得一提的是,今年 3 月末,DeepSeek 曾连续三天出现大规模服务异常。而 DeepSeek 新一代旗舰大模型 DeepSeek V4,则被曝将于 4 月下旬正式发布。此外,根据 DeepSeek 近期发布的招聘岗位,有猜测称,其有意在内蒙自建数据中心。
有观点认为,在此关键时间节点,本轮融资若能完成,将有助于 DeepSeek 推进模型迭代、人才引进以及全球市场扩张。
向外部资本敞开大门,DeepSeek 被传融资
近期,DeepSeek 被传融资的消息,在投资圈和 AI 圈激起千层浪。
报道称,DeepSeek 正在以超 100 亿美元(约合人民币 682 亿元)的估值,计划募集不少于 3 亿美元(约合人民币 20 亿元)资金。
天眼查显示,DeepSeek 所属公司为杭州深度求索人工智能基础技术研究有限公司,其成立于 2023 年 7 月。
长期以来,DeepSeek 在业内以 " 不融资 " 著称,公司运营资金主要依靠创始人梁文锋名下的幻方量化提供支持。
据晚点 LatePost,2023 年,梁文锋曾小范围见过一些投资人。但梁文锋希望投资方接受一个回报上限,这导致不少投资机构望而却步。
此后数年,尽管 DeepSeek 凭借低成本模型在业内引发轰动,但梁文锋却未再与其他投资人接触,甚至不建立新的联系。
据《The Information》报道,在本轮 DeepSeek 寻求外部融资前,公司甚至多次拒绝了国内知名风险投资公司和大型科技公司的接洽。
而 DeepSeek 此次打破常规寻求外部资金,折射出人工智能行业面临的普遍挑战:随着竞争日趋激烈,玩家想要在赛道内保持领先地位,便需要巨额的资金投入。
值得一提的是,今年 4 月初,DeepSeek 招聘出现新动态,首次出现工作地为内蒙古乌兰察布的岗位,此前公司办公地点基本在北京和杭州。
而 DeepSeek 此次招聘的两个岗位,分别为数据中心高级运维工程师、数据中心高级交付经理,薪资都在 1.5 万至 3 万元的区间内。
据悉,这是 DeepSeek 首次招聘物理基础设施岗位,此前公司更多是租用云服务。这被外界普遍解读为,DeepSeek 或将在内蒙搭建属于自己的数据中心。
此外,目前正值 DeepSeek V4 即将发布的关键节点。有消息称,该版本模型参数规模达到万亿级别,支持百万级上下文长度,同时将放弃长期依赖的英伟达芯片,首次实现对华为昇腾等国产 AI 芯片的深度适配与优化。
为了完成从英伟达的 CUDA 到华为的 CANN 架构的生态迁移,DeepSeek 的工程师们花了大量时间解决 V4 对华为芯片的适配问题,重写核心代码。
因此,有观点认为,前述举动所带来的多重资金压力,或是 DeepSeek 此番寻求融资的重要原因。
核心人员频频出走,或为期权定价留人才
DeepSeek 对外部资本的态度转变,或也隐藏着为期权定价留人才的意图。
自 2025 年初爆火以来,各大科技巨头便盯上了 DeepSeek 这颗 AI 行业冉冉升起的新星。正因如此,从 LLM 基础架构、多模态、OCR 到推理、Agent,公司在多个技术方向上都面临核心人员被 " 挖角 " 的挑战。
据虎嗅去年 6 月消息,半年前,某 DeepSeek 核心高管已悄然离职创业,并获得 IDG 资本融资,计划于 2025 年圣诞节前后发布 Agent 产品。
有信源告诉虎嗅,该高管系原 DeepSeek CTO。不过,另有知情人士透露,DeepSeek 内部并无明确的 CTO 一职,但有承担相应工作的人士。
而在 2024 年末,还有传闻称,小米创始人雷军亲自出马,以千万级别的年薪力邀罗福莉加入小米。
一年后的 2025 年 11 月,这位参与了 DeepSeek-V2 研发工作的 "AI 才女 " 在朋友圈官宣加入小米,成为 Xiaomi MiMo 大模型的负责人。
去年年底,腾讯 "CEO/ 总裁办公室 " 的首席 AI 科学家姚顺雨又挖走了王炳宣。据悉,王炳宣是 DeepSeek 第一代大语言模型(LLM)的核心作者,此后参与历代模型训练。
今年春节前后,DeepSeek-OCR 系列的核心作者魏浩然也离开了公司,预计可能会入职某大厂。
今年 4 月 12 日,自动驾驶科技公司元戎启行 CEO 周光证实,DeepSeek 多模态技术核心研究员阮翀已于数月前加盟,担任首席科学家。
而就在近日,又有传言称,前 DeepSeek 95 后研究员郭达雅已被字节跳动以亿元年薪 " 挖角 "。
雷达财经了解到,郭达雅是代码智能与大模型推理方向的顶尖人才,其在 2023 年博士毕业后便加入 DeepSeek,深度参与了 DeepSeek 代码与推理方向的研究,并且是 DeepSeek V3、R1 以及 Coder、Math 等模型的核心贡献者。
今年 3 月被曝离职后,这位 " 天才少年 " 成为了各家大厂争相抢夺的 " 香饽饽 "。据中国基金报,字节跳动、百度、阿里均曾向其发出要约。
据晚点 LatePost 报道,郭达雅将在字节负责大模型研发组织 Seed,担任 Agent 负责人之一,职级为 L8。
不过,4 月 16 日晚,抖音集团副总裁李亮在微博发文称,近期没有招聘到近亿元年薪的员工。
李亮还指出,字节招聘所有 Seed 团队技术人员的薪资体系均一致,包括现金、字节期权和豆包期权三部分。其中,期权是四年期全部归属,并无 " 需要满足一定条件才能拿全 " 的情况。
但李亮也强调,假如业务发展的很好,不排除有些 Seed 技术人员四年后收益会达到数亿元。
一位投过大模型的投资人对第一财经表示,DeepSeek 即便开放融资,也不是大多数人的游戏,且按照梁文锋的想法,条款也一定异常严苛。对于这次融资转向,该投资人判断大概率是为了员工期权定价和兑现,且 " 做得太晚了 "。
不再仅依赖幻方量化 " 输血 "," 独特性 " 将如何维系?
作为创始人和掌舵者,梁文锋堪称 DeepSeek 的 " 灵魂人物 "。
公开资料显示,梁文锋 1985 年生于广东湛江,17 岁便以吴川一中高考状元的成绩考上浙大本科电子信息工程专业,之后又继续攻读浙大信息与通信工程专业研究生。
2008 年金融危机肆虐时,还在读研的梁文锋看到了隐藏的机遇,开始研究如何使用机器学习等技术探索全自动量化交易。
2013 年,梁文锋和他的浙大校友徐进等人创立了以德国数学家卡尔 · 雅可比命名的投资公司——杭州雅克比投资管理有限公司。
两年后,梁文锋又创立了幻方量化,致力于通过数学和人工智能进行量化投资。
2016 年 10 月,幻方第一个由深度学习算法模型生成的股票仓位上线实盘交易,使用 GPU 进行计算。至 2017 年底,公司几乎所有的量化策略都已经采用 AI 模型计算。
2018 年,幻方确立以 AI 为公司的主要发展方向。2019 年,幻方 AI(幻方人工智能基础研究有限公司)注册成立,致力于 AI 的算法与基础应用研究。同年,幻方量化管理规模突破百亿。
年初有媒体援引私募排排网数据,幻方量化 2025 年的收益均值达 56.55%,在中国管理规模超百亿的量化私募业绩榜中位列第二,仅次于以 73.51% 收益均值登顶的灵均投资。
数据显示,幻方量化近三年的收益均值为 85.15%,近五年的收益均值为 114.35%。目前,幻方量化的管理规模已超 700 亿元。
有分析认为,幻方量化的丰厚业绩,为梁文锋旗下的 DeepSeek 提供了充足的研发资金。
不过,据晚点 LatePost 报道,尽管 DeepSeek 的绝对薪资不低,但外面给的更高。一些猎头表示,DeepSeek 的竞争对手开出了 " 难以拒绝的数字 "," 翻 2 到 3 倍问题不大 "," 其他公司开出 8 位数(算股票或期权)总包 "。
面对巨额邀约,虽然有不少人离开 DeepSeek,但更多人选择留下。因为他们认可梁文锋追求 AGI 的方式,愿意做并非竞争驱动的探索;也习惯了 DeepSeek 相对宽松、从容的研究氛围。
不少接触过梁文锋的人,这么描述他——他是当下中国 AI 界非常罕见的 " 兼具强大的 infra 工程能力和模型研究能力,又能调动资源 ",拥有 " 令人恐怖的学习能力 ",同时又 " 完全不像一个老板,而更像一个极客 "。
作为公司中各团队之间的 " 粘合剂 ",梁文锋让公司上下自发形成紧密协作。他几乎把所有时间投入到他认为应该聚焦的少数事上,他 " 组织研发、协调资源,也做具体研究 ",是个导师般的老板。
梁文锋还认为,一个人一天能高质量输出的时间很难超过 6 至 8 小时。加班疲劳下的昏庸判断,反而会浪费宝贵的算力资源,得不偿失。
因此 DeepSeek 没有明确的绩效考核和 DDL(截止时间)。公司不加班,员工也不打卡,平日多数成员会在 6 点至 7 点左右离开公司。
而这和国内外诸多 AI 巨头核心 AI 开发人员每周工作 70 至 80 小时的工作时间,形成鲜明对比。但在这样有些 " 特殊 " 的工作环境下,DeepSeek 此前却以史无前例的性价比一战成名。
不过,有观点认为,随着 AI 探索逐渐触及边际效益,各家为获得领先而付出的代价正在逐渐变大,DeepSeek 想要维系从前的工作模式,或也变得愈发困难。
若成功完成首轮融资,获得资金 " 输血 " 的 DeepSeek 后续能否再造 2025 年初的 "AI 神话 "?雷达财经将持续关注。