关于ZAKER 合作
IT之家 7分钟前

DeepSeek 开源新模型 V3.1:约 685B 参数,上下文长度拓展至 128K

IT 之家 8 月 20 日消息,DeepSeek 昨天深夜在 Hugging Face 上开源了新模型 V3.1-Base,根据介绍,该模型将上下文长度拓展至 128K,参数约为 685B。

IT 之家附开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

而在昨晚早些时候,DeepSeek 发布通知称,线上模型版本已升级至 V3.1,上下文长度拓展至 128k,可通过官方网页、App、小程序测试,API 接口调用方式保持不变。

需要注意的是,大家期待已久的 DeepSeek R2 仍没有确定的发布时间

相关标签
IT之家

IT之家

数码,科技,生活

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容