关于ZAKER Skills 合作
星途科讯 7分钟前

DeepSeek 估值超 500 亿美元,微软拟整合其模型

深度求索(DeepSeek)已完成超过 500 亿元人民币(约合 74 亿美元)的融资。知情人士透露,该公司当前估值已突破 500 亿美元,成为中国最具价值的人工智能初创企业。

在本轮融资中,深度求索创始人兼首席执行官梁文锋个人注资 30 亿元人民币。此前市场消息显示,腾讯控股正考虑投资约 14.8 亿美元。据悉,本轮多数参与者的资金将存入由梁文锋管理的有限合伙企业中。

技术突破与市场震荡

深度求索正式名称为杭州深度求索人工智能基础技术研究有限公司,系量化基金幻方资本旗下子公司。2025 年 1 月,该实验室开源高级推理模型 R1,其输出质量几乎可与 OpenAI 于 2024 年 12 月发布的 o1 模型媲美。凭借极高的硬件效率,R1 仅需少量算力即可进行推理,这一特性引发投资者对 AI 加速器需求下降的担忧,导致英伟达市值曾短暂缩水 15%。

今年 4 月,深度求索推出 R1 的后续版本 DeepSeek-V4-Pro。该模型包含 1.6 万亿参数,规模是前代的两倍以上,采用混合专家架构,仅在响应提示时激活 2840 亿个参数。训练数据集涵盖超过 32 万亿 token。

在推理效率方面,V4-Pro 利用优化的 KV 缓存数据结构,能够处理包含 100 万 token 的提示,其缓存大小仅为早期模型 DeepSeek-V3.2 的十分之一。这一突破显著降低了内存占用及推理成本。

微软寻求成本替代方案

深度求索算法的高性价比已引起科技巨头关注。据媒体报道,微软计划将其定制的深度求索模型整合至正式面向公众发布的 Cowork Copilot 应用中,旨在为目前支撑该软件运行的 OpenAI 和 Anthropic 算法提供更具成本效益的替代方案。

微软预计将在未来几周内推出该定制模型,主要使用经过微调的 DeepSeek V4 或其他开源模型。微调技术允许开发者针对特定工作负载优化 AI,从而提升输出质量与响应速度。

【星途科讯 图文丨程砚铮】

最新评论

没有更多评论了
星途科讯

星途科讯

解码海外,科技新知

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容