8 月 7 日,阿里通义千问发布更小尺寸新模型—— Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507。据通义千问介绍,在非推理领域,Qwen3-4B-Instruct-2507 全面超越了闭源的 GPT4.1-Nano;在推理领域,Qwen3-4B-Thinking-2507 甚至可以媲美中等规模的 Qwen3-30B-A3B(thinking)。目前新模型已在魔搭社区、HuggingFace 正式开源。(界面)
36氪
9分钟前
阿里通义千问发布小尺寸模型 Qwen3-4B 新版本
相关标签