IT 之家 8 月 20 日消息,DeepSeek 昨天深夜在 Hugging Face 上开源了新模型 V3.1-Base,根据介绍,该模型将上下文长度拓展至 128K,参数约为 685B。
而在昨晚早些时候,DeepSeek 发布通知称,线上模型版本已升级至 V3.1,上下文长度拓展至 128k,可通过官方网页、App、小程序测试,API 接口调用方式保持不变。
需要注意的是,大家期待已久的 DeepSeek R2 仍没有确定的发布时间。
IT 之家 8 月 20 日消息,DeepSeek 昨天深夜在 Hugging Face 上开源了新模型 V3.1-Base,根据介绍,该模型将上下文长度拓展至 128K,参数约为 685B。
而在昨晚早些时候,DeepSeek 发布通知称,线上模型版本已升级至 V3.1,上下文长度拓展至 128k,可通过官方网页、App、小程序测试,API 接口调用方式保持不变。
需要注意的是,大家期待已久的 DeepSeek R2 仍没有确定的发布时间。
觉得文章不错,微信扫描分享好友