被大厂围猎也与其合作 , 竞合中的 DeepSeek V4 是怎么上线的

2026 年 4 月 24 日，DeepSeek V4 系列模型在数次延期后终于上线。此次技术发布备受关注，对 DeepSeek 来说，更是一次艰难的战略突围。

在一众大厂纷纷站队、融资、烧钱投流的喧嚣中，DeepSeek 既要应对巨头们从人才到市场的全方位 " 围猎 "，又不得不在算力、入口等维度与它们保持微妙的 " 合作 "。V4 的上线，正是这种竞合张力下的产物。

为 " 干活 " 而生，但仍有取舍

根据官方公布，V4 系列包含 V4-Pro 和 V4-Flash 两个版本。这次升级的核心逻辑并非简单追求 Benchmark（基准测试）上的领先，而是围绕 " 让 AI 真正用得起 " 来设计产品。1M 上下文成为所有官方服务的标配，不再作为高端卖点；V4-Flash 输出定价低至 2 元 / 百万 token，单 token 算力消耗仅为此前版本的 10% 至 27%，比 GPT-5.5 低两个数量级，大幅降低了开发者的使用门槛。

在能力定位上，V4 从 " 聊天 " 转向 " 干活 " 的意图明显。DeepSeek 内部员工已全面用 V4-Pro 替代原有编程工具，其交付质量接近 Claude Opus 4.6 的非思考模式。针对 Claude Code、OpenClaw 等主流 Agent 框架的专项适配也已完成。显然，DeepSeek 并未发力应用，而是专注于提供高性价比的底层模型。

但 DeepSeek 官方也坦承了 V4 的短板，其整体能力仍落后 GPT-5.4 和 Gemini-3.1-Pro 约 3 至 6 个月，复杂深度推理与 Opus 4.6 思考模式存在阶段性差距；目前 V4 暂不支持多模态功能，业内人士分析原因也与算力和现金掣肘有关，团队在多模态训练和 Agent 优化之间做出了取舍。

这是整个 V4 发布过程中不得不做出的取舍，在算力和资金面前，这家以理想主义著称的公司不得不务实地做出这样的选择。

华为昇腾扮演 " 关键先生 "

V4 发布当天，华为同步宣布昇腾 950 超节点已全面适配该系列模型，V4-Pro 可实现约 20ms 的单 token 解码时延。华为称其 " 重新定义了长文本推理的性能天花板 "。英伟达 CEO 黄仁勋今年 1 月底曾表示，"DeepSeek 首次在华为芯片上线的那一天，对我们来说会是一个可怕的结果。" 现在，这个结果已经出现。

为了这一天，DeepSeek 团队付出了多次版本延期的代价。根据官方发布的信息，V4 开发过程中，团队重写了大量核心代码，完成了从 CUDA 到华为 CANN 生态的技术栈迁移。值得注意的是，V4 并未向英伟达开放测试，而是优先与华为及寒武纪合作。

算力自主化的另一个信号来自地理维度。DeepSeek 近期在内蒙古乌兰察布发布了多个数据中心岗位，月薪开至 15-30K · 14 薪，是当地薪资平均水平的 4 到 6 倍。公开信息显示，乌兰察布电价优势明显，当地电价比京津冀低约 50%，且年均气温 4.3 ℃可自然制冷近 10 个月；与此同时，乌兰察布是 " 东数西算 " 八大枢纽之一，地理优势明显，距北京直线仅 240 公里，算力时延控制在 4.2 毫秒。

根据 DeepSeek 官方消息，其一期在乌兰察布规划约 2 万张芯片混用 H800 和昇腾 910，远期扩展至 5 万张以上。这标志着 DeepSeek 正从 " 租用云服务的算法公司 " 转向 " 自建算力基础设施的运营商 "。一位业内人士评价，这相当于 DeepSeek 拥有了自己的 " 算力工厂 "，不仅能保证 V4 的稳定运行，也为未来的 V5、V6 铺路。

回到 V4 本身，同样受限于高端算力，目前 V4-Pro 版的服务吞吐十分有限，预计下半年昇腾 950 超节点批量上市后价格才会大幅下调。

大厂砸钱挖人，精准到每条技术线

功能上的取舍和算力自主战略背后，是 DeepSeek 难以避开的激烈的行业竞争。大厂仍采取惯用的砸钱挖人战术。在 DeepSeek V4 沉默研发的这 15 个月里，大厂对它的 " 人才围猎 " 从未停止，且精准到了每条技术主线。

据 36 氪、晚点 LatePost 等多家媒体报道，DeepSeek 至少 5 名核心研发成员确认离职，覆盖了基座模型、推理、OCR、多模态四条核心技术主线。

其中王炳宣，系 DeepSeek 第一代大语言模型核心作者、公司元老，于 2025 年底被腾讯挖走；罗福莉，DeepSeek-V3 关键开发者，2025 年 11 月正式加入小米，担任小米 MiMo 大模型负责人，据传雷军以千万年薪招揽（小米及本人未证实）；郭达雅，DeepSeek-R1 核心研究员、GRPO 算法主要提出者，2026 年 3 月离职，随后加入字节跳动 Seed 团队担任 Agent 方向负责人，不过字节官方已否认 " 亿元年薪 " 传闻；魏浩然，系 DeepSeek OCR 系列核心作者，于 2026 年春节前后离职，去向尚未公开；阮翀，多模态成果核心贡献者，从幻方时期即加入 DeepSeek，2026 年 1 月官宣加入自动驾驶公司元戎启行，出任首席科学家。

5 个人，覆盖了 DeepSeek 从基模到推理、从 OCR 到多模态的全部技术命脉。一位杭州某科技企业的创始人兼 CEO 告诉财闻，大厂资本实力雄厚，但由于组织等 " 大公司病 "，在从 0 到 1 的新业务方面往往会慢半拍，而他们最擅长的就是通过高薪挖人来进行业务 " 复刻 "，并与创业公司展开竞争。

大厂的策略清晰而直接，相比之下，DeepSeek 由幻方量化支持的期权在缺乏融资的情况下缺少流动性，持有者无法确定其真实价值。一位业内人士称："DeepSeek 的期权在账面上可能是天文数字，在现实中是一张无法兑现的期票。" 这种 " 流动性折价 " 在人才争夺战中正成为 DeepSeek 越来越明显的软肋。

对此招商证券国际在最新研报中提出，V4 发布后需 " 密切关注各大模型厂商模型迭代、商业化进展、人才流动等情况 "。券商将 " 人才流动 " 与 " 模型迭代 " 并列作为核心观察指标，这在以往的行业分析中并不多见，这背后是整个 AI 行业已形成的共识——竞争不仅在算力、算法，更在 " 人 "。

双重围攻：同行的错峰与大厂的市场卡位

除了才 " 后方堡垒 " 被攻破的同时，DeepSeek 在产品市场层面也面临着 " 双重围攻 "，来自同行的错峰竞争，以及来自大厂的投流封锁。

在 DeepSeek 多次跳票的窗口期里，同赛道的创业公司选择 " 抢跑 "。智谱和 MiniMax 在 2026 年春节前 " 错峰 " 发布了新模型 GLM 5 和 M 2.5。《智能涌现》报道一名智谱员工透露，"DeepSeek 将在春节发模型 " 的传言一出，算法团队立刻被要求 " 尽早 " 发布。MiniMax 的一名员工也表示，港股 IPO 庆功酒的宿醉还没褪去，算法团队就自觉回到了工位上。

" 错峰 " 的核心逻辑是避险，" 如果比 DeepSeek 晚发，性能不如它们，会影响股价；但不发，也会影响股价，" 上述员工表示，" 影响最小的办法，是早发。"V4 发布当日，智谱和 MiniMax 的股价应声下跌，市场对 DeepSeek 重估行业标准的恐惧可见一斑。

相比同行的 " 抢跑 "，互联网大厂的竞争更加系统化，资本和入口成了挤压 DeepSeek 的市场空间两个武器。

首先是投流大战。 2026 年春节期间，字节跳动投入 10 亿元将豆包送上春晚舞台；阿里千问豪掷 30 亿元请用户喝奶茶；腾讯元宝撒 10 亿元红包。三大厂在短短一个月内烧掉 50 亿元，目的只有一个，就是抢占 C 端用户心智。相比之下，DeepSeek 几乎没有任何市场投放预算，完全依赖口碑传播。

其次是入口封锁。腾讯元宝虽然接入了 DeepSeek，但在微信、QQ 等核心场景中，腾讯优先推荐的是自家的混元模型；字节跳动的豆包在抖音、今日头条中有天然入口优势；阿里的千问则在钉钉、淘宝中深度集成。一位开发者告诉财闻：" 在阿里云上，千问的推荐位永远在第一位，DeepSeek 要翻好几页才能找到。" 这种隐形的 " 入口倾斜 "，让没有自有流量入口的 DeepSeek 在用户触达上处于天然劣势。

在巨头阴影下寻找合作空间

然而，DeepSeek 并非只是在被动应对这些竞争。在另一个维度上，它也在主动寻求与大厂的 " 合作 "，以换取生存和发展的空间。

最典型的案例是与腾讯的合作。腾讯元宝已深度绑定 DeepSeek 模型，其用户量暴涨与这一合作有直接因果关系，据元宝官方数据，自 2025 年 2 月接入 DeepSeek 以来，用户规模逐步扩大，2025 年 12 月 14 日当天使用量达到新高，较年初增长超过 100 倍。对于 DeepSeek 而言，腾讯的社交和办公场景，微信、QQ、腾讯会议、企业微信是其 Agent 技术落地的天然试验田；对于腾讯而言，元宝借助 DeepSeek 的技术能力，迅速缩小了与竞争对手的差距。

与阿里的关系则更加微妙。虽然通义千问是 DeepSeek 的直接竞品，但阿里云作为算力基础设施方，与 DeepSeek 在乌兰察布等地的数据中心建设上存在广阔的合作空间。更关键的是，阿里的通义千问系列模型曾作为 DeepSeek 蒸馏模型的底座，DeepSeek-R1-Distill-Qwen 系列证明了双方在开源生态上的交集。

在这样的竞合中，DeepSeek 似乎也做出了一个决定性的转变，开始在融资上松口。

2026 年 4 月中旬，多家媒体报道 DeepSeek 正在洽谈首轮外部融资。据《The Information》率先报道，融资谈判涉及阿里巴巴和腾讯，DeepSeek 的估值据称在短短几天内从 100 亿美元翻倍至 200 亿美元。《财经》进一步报道称，两家预计合计投资 18 亿美元，但交易方案尚未完全敲定。

但据澎湃新闻报道，知情人士否认了阿里腾讯投资的消息，表示 " 相关传言不实 "。有媒体报道称，" 梁文锋的电话被投资人打爆了。" 一位上海的科技圈的投资人告诉财闻，这种说法基本属实，大家都想投 DeepSeek，但资本进入以后，DeepSeek 能否在战略上完全自主就不一定了，多少会受到一些影响。所以，DeepSeek 的融资一定需要一个长期和深入的沟通过程。

2023 年，梁文锋拒绝了所有外部投资，坚持独立发展。他曾直言 "VC 谈不到一块去 "。三年后，核心人才出走、V4 延宕再三、国产算力适配工程量远超预期——这些纯粹的技术理想，终究要为算力账单和人才账单买单。

据《智能涌现》报道，DeepSeek 转向融资的外部导火索之一，与腾讯的投资态度有关。在开放融资前，梁文锋和马化腾曾就独家注资有过几次商谈，但 " 给腾讯 20% 股份的条件，没有得到梁文锋的同意 "。这也解释了为何最终的融资方案是两家同时入局——梁文锋显然不希望任何一家大厂获得足以影响决策的股权比例。

如果融资成真，DeepSeek 或将获得阿里云计算资源的优先保障。

招商证券国际在最新研报中指出，DeepSeek 的上述举措中，" 龙头云厂商，阿里、腾讯、华为等将直接受益，MaaS 平台收入持续提升 "。这将是一个深层次的利益绑定，无论 DeepSeek 最终拿到谁的钱，它都已经成为所有云厂商必须接入的 " 优质模型供应商 "。

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

被大厂围猎也与其合作 , 竞合中的 DeepSeek V4 是怎么上线的

宙世代

一起剪

相关阅读

马斯克诉奥尔特曼案下周开庭 我们现在知道哪些信息？

印尼财长改口：没打算在马六甲海峡收“通行费”

美国富豪非洲狩猎时遭象群踩死：只剩一团残肢断骸

世界最速！镜识科技Bolt人形机器人奔跑速度提升至11米/秒

以实战证实力，纵横G700完成全球首个载人航行应急演练

全是反转！《八千里路云和月》40集大结局，是今年看过最遗憾结局

八千里路云和月大结局：张云魁负丁玉娇，孟万福没死，小月最惨！

一部剧把仇恨做成产品：观众边骂边摇

2%GDP的家族：韩剧里的财阀权力密码

ABC新剧命运待定，主创为何＂感觉良好＂？

一个编剧为何把自己写进暴力深渊？

美国特种兵赌马杜罗下台赚了40万美元，特朗普回应：“这世界疯了，已经变成了一个赌场”

逐玉大结局：俞宝儿登基成新皇，谢征樊长玉保家卫国成栋梁！

特朗普：这世界疯了

春播春管不误，苗情不负

最新评论

企业资讯

热门推荐

企业资讯

马斯克诉奥尔特曼案下周开庭我们现在知道哪些信息？