关于ZAKER Skills 合作
财闻 3小时前

被大厂围猎也与其合作 , 竞合中的 DeepSeek V4 是怎么上线的

2026 年 4 月 24 日,DeepSeek V4 系列模型在数次延期后终于上线。此次技术发布备受关注,对 DeepSeek 来说,更是一次艰难的战略突围。

在一众大厂纷纷站队、融资、烧钱投流的喧嚣中,DeepSeek 既要应对巨头们从人才到市场的全方位 " 围猎 ",又不得不在算力、入口等维度与它们保持微妙的 " 合作 "。V4 的上线,正是这种竞合张力下的产物。

为 " 干活 " 而生,但仍有取舍

根据官方公布,V4 系列包含 V4-Pro 和 V4-Flash 两个版本。这次升级的核心逻辑并非简单追求 Benchmark(基准测试)上的领先,而是围绕 " 让 AI 真正用得起 " 来设计产品。1M 上下文成为所有官方服务的标配,不再作为高端卖点;V4-Flash 输出定价低至 2 元 / 百万 token,单 token 算力消耗仅为此前版本的 10% 至 27%,比 GPT-5.5 低两个数量级,大幅降低了开发者的使用门槛。

在能力定位上,V4 从 " 聊天 " 转向 " 干活 " 的意图明显。DeepSeek 内部员工已全面用 V4-Pro 替代原有编程工具,其交付质量接近 Claude Opus 4.6 的非思考模式。针对 Claude Code、OpenClaw 等主流 Agent 框架的专项适配也已完成。显然,DeepSeek 并未发力应用,而是专注于提供高性价比的底层模型。

但 DeepSeek 官方也坦承了 V4 的短板,其整体能力仍落后 GPT-5.4 和 Gemini-3.1-Pro 约 3 至 6 个月,复杂深度推理与 Opus 4.6 思考模式存在阶段性差距;目前 V4 暂不支持多模态功能,业内人士分析原因也与算力和现金掣肘有关,团队在多模态训练和 Agent 优化之间做出了取舍。

这是整个 V4 发布过程中不得不做出的取舍,在算力和资金面前,这家以理想主义著称的公司不得不务实地做出这样的选择。

华为昇腾扮演 " 关键先生 "

V4 发布当天,华为同步宣布昇腾 950 超节点已全面适配该系列模型,V4-Pro 可实现约 20ms 的单 token 解码时延。华为称其 " 重新定义了长文本推理的性能天花板 "。英伟达 CEO 黄仁勋今年 1 月底曾表示,"DeepSeek 首次在华为芯片上线的那一天,对我们来说会是一个可怕的结果。" 现在,这个结果已经出现。

为了这一天,DeepSeek 团队付出了多次版本延期的代价。根据官方发布的信息,V4 开发过程中,团队重写了大量核心代码,完成了从 CUDA 到华为 CANN 生态的技术栈迁移。值得注意的是,V4 并未向英伟达开放测试,而是优先与华为及寒武纪合作。

算力自主化的另一个信号来自地理维度。DeepSeek 近期在内蒙古乌兰察布发布了多个数据中心岗位,月薪开至 15-30K · 14 薪,是当地薪资平均水平的 4 到 6 倍。公开信息显示,乌兰察布电价优势明显,当地电价比京津冀低约 50%,且年均气温 4.3 ℃可自然制冷近 10 个月;与此同时,乌兰察布是 " 东数西算 " 八大枢纽之一,地理优势明显,距北京直线仅 240 公里,算力时延控制在 4.2 毫秒。

根据 DeepSeek 官方消息,其一期在乌兰察布规划约 2 万张芯片混用 H800 和昇腾 910,远期扩展至 5 万张以上。这标志着 DeepSeek 正从 " 租用云服务的算法公司 " 转向 " 自建算力基础设施的运营商 "。一位业内人士评价,这相当于 DeepSeek 拥有了自己的 " 算力工厂 ",不仅能保证 V4 的稳定运行,也为未来的 V5、V6 铺路。

回到 V4 本身,同样受限于高端算力,目前 V4-Pro 版的服务吞吐十分有限,预计下半年昇腾 950 超节点批量上市后价格才会大幅下调。

大厂砸钱挖人,精准到每条技术线

功能上的取舍和算力自主战略背后,是 DeepSeek 难以避开的激烈的行业竞争。大厂仍采取惯用的砸钱挖人战术。在 DeepSeek V4 沉默研发的这 15 个月里,大厂对它的 " 人才围猎 " 从未停止,且精准到了每条技术主线。

据 36 氪、晚点 LatePost 等多家媒体报道,DeepSeek 至少 5 名核心研发成员确认离职,覆盖了基座模型、推理、OCR、多模态四条核心技术主线。

其中王炳宣,系 DeepSeek 第一代大语言模型核心作者、公司元老,于 2025 年底被腾讯挖走;罗福莉,DeepSeek-V3 关键开发者,2025 年 11 月正式加入小米,担任小米 MiMo 大模型负责人,据传雷军以千万年薪招揽(小米及本人未证实);郭达雅,DeepSeek-R1 核心研究员、GRPO 算法主要提出者,2026 年 3 月离职,随后加入字节跳动 Seed 团队担任 Agent 方向负责人,不过字节官方已否认 " 亿元年薪 " 传闻;魏浩然,系 DeepSeek OCR 系列核心作者,于 2026 年春节前后离职,去向尚未公开;阮翀,多模态成果核心贡献者,从幻方时期即加入 DeepSeek,2026 年 1 月官宣加入自动驾驶公司元戎启行,出任首席科学家。

5 个人,覆盖了 DeepSeek 从基模到推理、从 OCR 到多模态的全部技术命脉。一位杭州某科技企业的创始人兼 CEO 告诉财闻,大厂资本实力雄厚,但由于组织等 " 大公司病 ",在从 0 到 1 的新业务方面往往会慢半拍,而他们最擅长的就是通过高薪挖人来进行业务 " 复刻 ",并与创业公司展开竞争。

大厂的策略清晰而直接,相比之下,DeepSeek 由幻方量化支持的期权在缺乏融资的情况下缺少流动性,持有者无法确定其真实价值。一位业内人士称:"DeepSeek 的期权在账面上可能是天文数字,在现实中是一张无法兑现的期票。" 这种 " 流动性折价 " 在人才争夺战中正成为 DeepSeek 越来越明显的软肋。

对此招商证券国际在最新研报中提出,V4 发布后需 " 密切关注各大模型厂商模型迭代、商业化进展、人才流动等情况 "。券商将 " 人才流动 " 与 " 模型迭代 " 并列作为核心观察指标,这在以往的行业分析中并不多见,这背后是整个 AI 行业已形成的共识——竞争不仅在算力、算法,更在 " 人 "。

双重围攻:同行的错峰与大厂的市场卡位

除了才 " 后方堡垒 " 被攻破的同时,DeepSeek 在产品市场层面也面临着 " 双重围攻 ",来自同行的错峰竞争,以及来自大厂的投流封锁。

在 DeepSeek 多次跳票的窗口期里,同赛道的创业公司选择 " 抢跑 "。智谱和 MiniMax 在 2026 年春节前 " 错峰 " 发布了新模型 GLM 5 和 M 2.5。《智能涌现》报道一名智谱员工透露,"DeepSeek 将在春节发模型 " 的传言一出,算法团队立刻被要求 " 尽早 " 发布。MiniMax 的一名员工也表示,港股 IPO 庆功酒的宿醉还没褪去,算法团队就自觉回到了工位上。

" 错峰 " 的核心逻辑是避险," 如果比 DeepSeek 晚发,性能不如它们,会影响股价;但不发,也会影响股价," 上述员工表示," 影响最小的办法,是早发。"V4 发布当日,智谱和 MiniMax 的股价应声下跌,市场对 DeepSeek 重估行业标准的恐惧可见一斑。

相比同行的 " 抢跑 ",互联网大厂的竞争更加系统化,资本和入口成了挤压 DeepSeek 的市场空间两个武器。

首先是投流大战。 2026 年春节期间,字节跳动投入 10 亿元将豆包送上春晚舞台;阿里千问豪掷 30 亿元请用户喝奶茶;腾讯元宝撒 10 亿元红包。三大厂在短短一个月内烧掉 50 亿元,目的只有一个,就是抢占 C 端用户心智。相比之下,DeepSeek 几乎没有任何市场投放预算,完全依赖口碑传播。

其次是入口封锁。 腾讯元宝虽然接入了 DeepSeek,但在微信、QQ 等核心场景中,腾讯优先推荐的是自家的混元模型;字节跳动的豆包在抖音、今日头条中有天然入口优势;阿里的千问则在钉钉、淘宝中深度集成。一位开发者告诉财闻:" 在阿里云上,千问的推荐位永远在第一位,DeepSeek 要翻好几页才能找到。" 这种隐形的 " 入口倾斜 ",让没有自有流量入口的 DeepSeek 在用户触达上处于天然劣势。

在巨头阴影下寻找合作空间

然而,DeepSeek 并非只是在被动应对这些竞争。在另一个维度上,它也在主动寻求与大厂的 " 合作 ",以换取生存和发展的空间。

最典型的案例是与腾讯的合作。腾讯元宝已深度绑定 DeepSeek 模型,其用户量暴涨与这一合作有直接因果关系,据元宝官方数据,自 2025 年 2 月接入 DeepSeek 以来,用户规模逐步扩大,2025 年 12 月 14 日当天使用量达到新高,较年初增长超过 100 倍。对于 DeepSeek 而言,腾讯的社交和办公场景,微信、QQ、腾讯会议、企业微信是其 Agent 技术落地的天然试验田;对于腾讯而言,元宝借助 DeepSeek 的技术能力,迅速缩小了与竞争对手的差距。

与阿里的关系则更加微妙。虽然通义千问是 DeepSeek 的直接竞品,但阿里云作为算力基础设施方,与 DeepSeek 在乌兰察布等地的数据中心建设上存在广阔的合作空间。更关键的是,阿里的通义千问系列模型曾作为 DeepSeek 蒸馏模型的底座,DeepSeek-R1-Distill-Qwen 系列证明了双方在开源生态上的交集。

在这样的竞合中,DeepSeek 似乎也做出了一个决定性的转变,开始在融资上松口。

2026 年 4 月中旬,多家媒体报道 DeepSeek 正在洽谈首轮外部融资。据《The Information》率先报道,融资谈判涉及阿里巴巴和腾讯,DeepSeek 的估值据称在短短几天内从 100 亿美元翻倍至 200 亿美元。《财经》进一步报道称,两家预计合计投资 18 亿美元,但交易方案尚未完全敲定。

但据澎湃新闻报道,知情人士否认了阿里腾讯投资的消息,表示 " 相关传言不实 "。有媒体报道称," 梁文锋的电话被投资人打爆了。" 一位上海的科技圈的投资人告诉财闻,这种说法基本属实,大家都想投 DeepSeek,但资本进入以后,DeepSeek 能否在战略上完全自主就不一定了,多少会受到一些影响。所以,DeepSeek 的融资一定需要一个长期和深入的沟通过程。

2023 年,梁文锋拒绝了所有外部投资,坚持独立发展。他曾直言 "VC 谈不到一块去 "。三年后,核心人才出走、V4 延宕再三、国产算力适配工程量远超预期——这些纯粹的技术理想,终究要为算力账单和人才账单买单。

据《智能涌现》报道,DeepSeek 转向融资的外部导火索之一,与腾讯的投资态度有关。在开放融资前,梁文锋和马化腾曾就独家注资有过几次商谈,但 " 给腾讯 20% 股份的条件,没有得到梁文锋的同意 "。这也解释了为何最终的融资方案是两家同时入局——梁文锋显然不希望任何一家大厂获得足以影响决策的股权比例。

如果融资成真,DeepSeek 或将获得阿里云计算资源的优先保障。

招商证券国际在最新研报中指出,DeepSeek 的上述举措中," 龙头云厂商,阿里、腾讯、华为等将直接受益,MaaS 平台收入持续提升 "。这将是一个深层次的利益绑定,无论 DeepSeek 最终拿到谁的钱,它都已经成为所有云厂商必须接入的 " 优质模型供应商 "。

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容