关于ZAKER 合作
36氪 9分钟前

阿里通义千问发布小尺寸模型 Qwen3-4B 新版本

8 月 7 日,阿里通义千问发布更小尺寸新模型—— Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507。据通义千问介绍,在非推理领域,Qwen3-4B-Instruct-2507 全面超越了闭源的 GPT4.1-Nano;在推理领域,Qwen3-4B-Thinking-2507 甚至可以媲美中等规模的 Qwen3-30B-A3B(thinking)。目前新模型已在魔搭社区、HuggingFace 正式开源。(界面)

相关标签
36氪

36氪

让创业更简单

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容