梁文锋罕见“松口” ,680 亿 DeepSeek 也“缺钱”了 ?

雷达财经出品文 | 丁禹编 | 孟帅

在 AI 巨头们全力厮杀的当下，昔日 " 特立独行 "、长期将外部资本 " 拒之门外 " 的 DeepSeek 也 " 缺钱 " 了？

据外媒 4 月 17 日消息，深度求索（DeepSeek）正就首次引入外部资本展开洽谈，希望充实资金储备，以便在研发顶尖人工智能模型的高成本竞争中占据更有利地位。

报道称，DeepSeek 计划募集不少于 3 亿美元资金（约合人民币 20 亿元），对应的公司估值至少为 100 亿美元（约人民币 682 亿元）。不过，这一估值远低于去年外媒给出的最高 1500 亿美元。

DeepSeek 传出融资消息之际，其人才外流现象也受到外界关注，近有被传字节高薪挖走的 95 后研究员郭达雅，更早之前还有出走小米的 "AI 才女 " 罗福莉、以及被腾讯挖走的 DeepSeek LLM 核心作者王炳宣等。

值得一提的是，今年 3 月末，DeepSeek 曾连续三天出现大规模服务异常。而 DeepSeek 新一代旗舰大模型 DeepSeek V4，则被曝将于 4 月下旬正式发布。此外，根据 DeepSeek 近期发布的招聘岗位，有猜测称，其有意在内蒙自建数据中心。

有观点认为，在此关键时间节点，本轮融资若能完成，将有助于 DeepSeek 推进模型迭代、人才引进以及全球市场扩张。

向外部资本敞开大门，DeepSeek 被传融资

近期，DeepSeek 被传融资的消息，在投资圈和 AI 圈激起千层浪。

报道称，DeepSeek 正在以超 100 亿美元（约合人民币 682 亿元）的估值，计划募集不少于 3 亿美元（约合人民币 20 亿元）资金。

天眼查显示，DeepSeek 所属公司为杭州深度求索人工智能基础技术研究有限公司，其成立于 2023 年 7 月。

长期以来，DeepSeek 在业内以 " 不融资 " 著称，公司运营资金主要依靠创始人梁文锋名下的幻方量化提供支持。

据晚点 LatePost，2023 年，梁文锋曾小范围见过一些投资人。但梁文锋希望投资方接受一个回报上限，这导致不少投资机构望而却步。

此后数年，尽管 DeepSeek 凭借低成本模型在业内引发轰动，但梁文锋却未再与其他投资人接触，甚至不建立新的联系。

据《The Information》报道，在本轮 DeepSeek 寻求外部融资前，公司甚至多次拒绝了国内知名风险投资公司和大型科技公司的接洽。

而 DeepSeek 此次打破常规寻求外部资金，折射出人工智能行业面临的普遍挑战：随着竞争日趋激烈，玩家想要在赛道内保持领先地位，便需要巨额的资金投入。

值得一提的是，今年 4 月初，DeepSeek 招聘出现新动态，首次出现工作地为内蒙古乌兰察布的岗位，此前公司办公地点基本在北京和杭州。

而 DeepSeek 此次招聘的两个岗位，分别为数据中心高级运维工程师、数据中心高级交付经理，薪资都在 1.5 万至 3 万元的区间内。

据悉，这是 DeepSeek 首次招聘物理基础设施岗位，此前公司更多是租用云服务。这被外界普遍解读为，DeepSeek 或将在内蒙搭建属于自己的数据中心。

此外，目前正值 DeepSeek V4 即将发布的关键节点。有消息称，该版本模型参数规模达到万亿级别，支持百万级上下文长度，同时将放弃长期依赖的英伟达芯片，首次实现对华为昇腾等国产 AI 芯片的深度适配与优化。

为了完成从英伟达的 CUDA 到华为的 CANN 架构的生态迁移，DeepSeek 的工程师们花了大量时间解决 V4 对华为芯片的适配问题，重写核心代码。

因此，有观点认为，前述举动所带来的多重资金压力，或是 DeepSeek 此番寻求融资的重要原因。

核心人员频频出走，或为期权定价留人才

DeepSeek 对外部资本的态度转变，或也隐藏着为期权定价留人才的意图。

自 2025 年初爆火以来，各大科技巨头便盯上了 DeepSeek 这颗 AI 行业冉冉升起的新星。正因如此，从 LLM 基础架构、多模态、OCR 到推理、Agent，公司在多个技术方向上都面临核心人员被 " 挖角 " 的挑战。

据虎嗅去年 6 月消息，半年前，某 DeepSeek 核心高管已悄然离职创业，并获得 IDG 资本融资，计划于 2025 年圣诞节前后发布 Agent 产品。

有信源告诉虎嗅，该高管系原 DeepSeek CTO。不过，另有知情人士透露，DeepSeek 内部并无明确的 CTO 一职，但有承担相应工作的人士。

而在 2024 年末，还有传闻称，小米创始人雷军亲自出马，以千万级别的年薪力邀罗福莉加入小米。

一年后的 2025 年 11 月，这位参与了 DeepSeek-V2 研发工作的 "AI 才女 " 在朋友圈官宣加入小米，成为 Xiaomi MiMo 大模型的负责人。

去年年底，腾讯 "CEO/ 总裁办公室 " 的首席 AI 科学家姚顺雨又挖走了王炳宣。据悉，王炳宣是 DeepSeek 第一代大语言模型（LLM）的核心作者，此后参与历代模型训练。

今年春节前后，DeepSeek-OCR 系列的核心作者魏浩然也离开了公司，预计可能会入职某大厂。

今年 4 月 12 日，自动驾驶科技公司元戎启行 CEO 周光证实，DeepSeek 多模态技术核心研究员阮翀已于数月前加盟，担任首席科学家。

而就在近日，又有传言称，前 DeepSeek 95 后研究员郭达雅已被字节跳动以亿元年薪 " 挖角 "。

雷达财经了解到，郭达雅是代码智能与大模型推理方向的顶尖人才，其在 2023 年博士毕业后便加入 DeepSeek，深度参与了 DeepSeek 代码与推理方向的研究，并且是 DeepSeek V3、R1 以及 Coder、Math 等模型的核心贡献者。

今年 3 月被曝离职后，这位 " 天才少年 " 成为了各家大厂争相抢夺的 " 香饽饽 "。据中国基金报，字节跳动、百度、阿里均曾向其发出要约。

据晚点 LatePost 报道，郭达雅将在字节负责大模型研发组织 Seed，担任 Agent 负责人之一，职级为 L8。

不过，4 月 16 日晚，抖音集团副总裁李亮在微博发文称，近期没有招聘到近亿元年薪的员工。

李亮还指出，字节招聘所有 Seed 团队技术人员的薪资体系均一致，包括现金、字节期权和豆包期权三部分。其中，期权是四年期全部归属，并无 " 需要满足一定条件才能拿全 " 的情况。

但李亮也强调，假如业务发展的很好，不排除有些 Seed 技术人员四年后收益会达到数亿元。

一位投过大模型的投资人对第一财经表示，DeepSeek 即便开放融资，也不是大多数人的游戏，且按照梁文锋的想法，条款也一定异常严苛。对于这次融资转向，该投资人判断大概率是为了员工期权定价和兑现，且 " 做得太晚了 "。

不再仅依赖幻方量化 " 输血 "，" 独特性 " 将如何维系？

作为创始人和掌舵者，梁文锋堪称 DeepSeek 的 " 灵魂人物 "。

公开资料显示，梁文锋 1985 年生于广东湛江，17 岁便以吴川一中高考状元的成绩考上浙大本科电子信息工程专业，之后又继续攻读浙大信息与通信工程专业研究生。

2008 年金融危机肆虐时，还在读研的梁文锋看到了隐藏的机遇，开始研究如何使用机器学习等技术探索全自动量化交易。

2013 年，梁文锋和他的浙大校友徐进等人创立了以德国数学家卡尔 · 雅可比命名的投资公司——杭州雅克比投资管理有限公司。

两年后，梁文锋又创立了幻方量化，致力于通过数学和人工智能进行量化投资。

2016 年 10 月，幻方第一个由深度学习算法模型生成的股票仓位上线实盘交易，使用 GPU 进行计算。至 2017 年底，公司几乎所有的量化策略都已经采用 AI 模型计算。

2018 年，幻方确立以 AI 为公司的主要发展方向。2019 年，幻方 AI（幻方人工智能基础研究有限公司）注册成立，致力于 AI 的算法与基础应用研究。同年，幻方量化管理规模突破百亿。

年初有媒体援引私募排排网数据，幻方量化 2025 年的收益均值达 56.55%，在中国管理规模超百亿的量化私募业绩榜中位列第二，仅次于以 73.51% 收益均值登顶的灵均投资。

数据显示，幻方量化近三年的收益均值为 85.15%，近五年的收益均值为 114.35%。目前，幻方量化的管理规模已超 700 亿元。

有分析认为，幻方量化的丰厚业绩，为梁文锋旗下的 DeepSeek 提供了充足的研发资金。

不过，据晚点 LatePost 报道，尽管 DeepSeek 的绝对薪资不低，但外面给的更高。一些猎头表示，DeepSeek 的竞争对手开出了 " 难以拒绝的数字 "，" 翻 2 到 3 倍问题不大 "，" 其他公司开出 8 位数（算股票或期权）总包 "。

面对巨额邀约，虽然有不少人离开 DeepSeek，但更多人选择留下。因为他们认可梁文锋追求 AGI 的方式，愿意做并非竞争驱动的探索；也习惯了 DeepSeek 相对宽松、从容的研究氛围。

不少接触过梁文锋的人，这么描述他——他是当下中国 AI 界非常罕见的 " 兼具强大的 infra 工程能力和模型研究能力，又能调动资源 "，拥有 " 令人恐怖的学习能力 "，同时又 " 完全不像一个老板，而更像一个极客 "。

作为公司中各团队之间的 " 粘合剂 "，梁文锋让公司上下自发形成紧密协作。他几乎把所有时间投入到他认为应该聚焦的少数事上，他 " 组织研发、协调资源，也做具体研究 "，是个导师般的老板。

梁文锋还认为，一个人一天能高质量输出的时间很难超过 6 至 8 小时。加班疲劳下的昏庸判断，反而会浪费宝贵的算力资源，得不偿失。

因此 DeepSeek 没有明确的绩效考核和 DDL（截止时间）。公司不加班，员工也不打卡，平日多数成员会在 6 点至 7 点左右离开公司。

而这和国内外诸多 AI 巨头核心 AI 开发人员每周工作 70 至 80 小时的工作时间，形成鲜明对比。但在这样有些 " 特殊 " 的工作环境下，DeepSeek 此前却以史无前例的性价比一战成名。

不过，有观点认为，随着 AI 探索逐渐触及边际效益，各家为获得领先而付出的代价正在逐渐变大，DeepSeek 想要维系从前的工作模式，或也变得愈发困难。

若成功完成首轮融资，获得资金 " 输血 " 的 DeepSeek 后续能否再造 2025 年初的 "AI 神话 "？雷达财经将持续关注。

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

梁文锋罕见“松口” ,680 亿 DeepSeek 也“缺钱”了 ?

宙世代

一起剪

相关阅读

卖出 6.1 亿片手机膜后，他们走上了一条最「重」的研发路

5月1日起施行！四川禁止或限制公共场所吸烟

高速快车道内一路逆行！女子：开太久脑子不清楚了

中国代表当场驳斥美方

省长鸣笛发令，全程参与万人健步大会

《蜜语纪》许蜜语升任大堂经理，接她班的为什么是臭脸的罗清萍

汽车营销的失效，是从审美坍塌开始的

“过度请示”，该纠偏了

任嘉伦最后1部古偶定档，双平台预约破400万，五劫换身虐恋能火吗

《蜜语纪》出圈，萤火单元破茧

这个春天，我最喜欢的一部剧↓

美国启动“第一阶段退款”

特斯拉就技术人员擅自解除限速致死车祸诉讼达成和解

《人民的名义》为什么像祁同伟这类人，很难在体制内混下去？

座头鲸在德国搁浅1个月 女学生：人为策划 为给博物馆提供骨架！

最新评论

企业资讯

热门推荐

企业资讯

座头鲸在德国搁浅1个月女学生：人为策划为给博物馆提供骨架！