
在本轮融资中,深度求索创始人兼首席执行官梁文锋个人注资 30 亿元人民币。此前市场消息显示,腾讯控股正考虑投资约 14.8 亿美元。据悉,本轮多数参与者的资金将存入由梁文锋管理的有限合伙企业中。
技术突破与市场震荡
深度求索正式名称为杭州深度求索人工智能基础技术研究有限公司,系量化基金幻方资本旗下子公司。2025 年 1 月,该实验室开源高级推理模型 R1,其输出质量几乎可与 OpenAI 于 2024 年 12 月发布的 o1 模型媲美。凭借极高的硬件效率,R1 仅需少量算力即可进行推理,这一特性引发投资者对 AI 加速器需求下降的担忧,导致英伟达市值曾短暂缩水 15%。
今年 4 月,深度求索推出 R1 的后续版本 DeepSeek-V4-Pro。该模型包含 1.6 万亿参数,规模是前代的两倍以上,采用混合专家架构,仅在响应提示时激活 2840 亿个参数。训练数据集涵盖超过 32 万亿 token。
在推理效率方面,V4-Pro 利用优化的 KV 缓存数据结构,能够处理包含 100 万 token 的提示,其缓存大小仅为早期模型 DeepSeek-V3.2 的十分之一。这一突破显著降低了内存占用及推理成本。
微软寻求成本替代方案
深度求索算法的高性价比已引起科技巨头关注。据媒体报道,微软计划将其定制的深度求索模型整合至正式面向公众发布的 Cowork Copilot 应用中,旨在为目前支撑该软件运行的 OpenAI 和 Anthropic 算法提供更具成本效益的替代方案。
微软预计将在未来几周内推出该定制模型,主要使用经过微调的 DeepSeek V4 或其他开源模型。微调技术允许开发者针对特定工作负载优化 AI,从而提升输出质量与响应速度。
【星途科讯 图文丨程砚铮】