Qwen3.6 超大杯来了！我用这个“半成品”模型，亲手造了一个 macOS 桌面

智东西

作者 | 陈骏达

编辑 | 心缘

智东西 4 月 20 日报道，今天，阿里发布了其下一代旗舰模型的早期预览版：Qwen3.6-Max-Preview。在第三方评测榜单 Artificial Analysis 的智能指数排名中，Qwen3.6-Max-Preview 的得分为 52 分，小幅超过 GLM-5.1、MiniMax-M2.7，成为这一榜单上得分最高的国产模型。

阿里并未披露这一模型的过多技术细节，比如参数量、支持何种模态等等。不过根据我们的初步体验，这应该是一个纯文本模型，支持思考和非思考模式，不支持图像等多模态内容。

与之前发布的 Qwen3.6-Plus 相比，Qwen3.6-Max-Preview 模型在智能体编程、世界知识和指令遵循方面均有明显可感的提升。

比如，我们让两个模型分别打造了一个 3D 赛车游戏。Qwen3.6-Max-Preview 打造的项目，虽然谈不上精美，但核心运行逻辑正常，是一个还不错的原型，后续可以基于这一项目进行迭代。

Qwen3.6-Plus 的结果基本没有可玩性，画面粗糙，暂时还没在这一任务中展现出从 0 到 1 完成项目的能力。

Qwen3.6-Max-Preview 还支持 preserve_thinking 功能，也就是在消息中保留所有前序轮次的思考内容。这一功能推荐用于智能体任务。

阿里上一次更新旗舰模型是在 1 个月前，当时发布的模型是 Qwen3.5-Max-Preview，也是预览版。今天发布的 Qwen3.6-Max-Preview 已在 Qwen Studio 上线供用户体验，同时也很快将上线阿里云百炼 API。

体验链接：https://chat.qwen.ai/

一、智能体编程能力有提升，实测能 one-shot 复刻 "macOS"

据阿里介绍，Qwen3.6-Max-Preview 最大的性能提升在于智能体编程能力。

在六项主流编程基准测试（SWE-bench Pro、Terminal-Bench 2.0、SkillsBench、QwenClawBench、QwenWebBench 和 SciCode）中，Qwen3.6-Max-Preview 取得了最高得分。这些测试覆盖了真实软件工程、终端与命令行交互、综合编程技能、OpenClaw 类 Agent 以及科学计算等核心能力。

智东西第一时间用几个案例考察了 Qwen3.6-Max-Preview 的智能体编程能力，也就是其理解用户高层次需求，自主规划任务实现路径，并最终交付完整项目的能力。

案例 1：模拟 macOS 桌面环境

提示词：生成一个 macOS 桌面环境，包含文件管理、浏览器、笔记等核心功能。

拿到这一任务后，Qwen3.6-Max-Preview 首先进行了规划，它意识到了自己无法构建真实的操作系统或完整复刻，但可通过前端技术呈现其视觉与交互特征，并据此设定了可行的任务目标，包括重点实现外观与行为的仿真。

使用过程中，能感觉到 Qwen3.6-Max-Preview 的 token 效率不错，没有浪费过多的 token 在无谓的反复思考和自我核验上，而是很快进行到正式的开发环节。

Qwen3.6-Max-Preview 用大概 3 分钟完成了原型的开发。其模拟出的 macOS 桌面效果逼真，交互方式与原版差异不大，浏览器功能也可以正常使用。

同样的任务交给 Qwen3.6-Plus，它也能做出个大概的外观，甚至还配上了壁纸，乍一看效果更好。但实际使用后，Qwen3.6-Plus 打造的系统还有不少 bug，像是浏览器、便签这样的系统 " 应用 " 是无法正常运行的。

这两个模型的差异在于，Qwen3.6-Max-Preview 能胜任更复杂的项目，考虑全面，而 Plus 更适合快速做原型，在具体的细节实现上还没有完全做到位。

案例 2：打造 MarkDown 编辑器

如果说上方的这一案例更像是开放性的开发任务，那么下面这一案例则对技术要求做了十分详细的规定，不仅考察模型的编程能力，也对指令遵循提出了要求。

提示词：

Qwen3.6-Max-Preview 和 Qwen3.6-Plus 都在理解提示词上花了不少时间，最终 Qwen3.6-Plus 先行交付了开发结果。其实，一开始 Qwen3.6-Plus 未能实现右侧的实时渲染和代码块功能，是在我们再次要求后才实现的，体现出它对仍然存在忽视部分提示词要求的可能。

Qwen3.6-Max-Preview 则一次性完成了下方这一编辑器的开发，提示词中定义的快捷键、链接插入功能、代码块功能等都正常运转，并在示例文本中得到体现，让用户可以一眼了解这一编辑器所支持的核心功能。

这一案例证明，在需要精确遵循复杂指令的任务中，Qwen3.6-Max-Preview 表现更优，体现出更强的指令理解与交付能力；而 Qwen3.6-Plus 虽然速度占优，但对细节的遗漏增加了沟通与修正成本。

其实，测试智能体编程能力的最佳场景，是将模型接入 Claude Code 或是 OpenClaw 这样的 Agent，在本地进行大型项目的开发，不过由于 Qwen3.6-Max-Preview 的 API 暂未完全开放，我们并未进行这一测试。

二、成功破解洗车难题，讲解复杂论文深入浅出

除了智能体编程能力之外，我们也对 Qwen3.6-Max-Preview 的其他能力维度做了考察。

比如，在逻辑推理方面，它可以看穿洗车店难题中的陷阱，直接给出判断：" 既然目的是洗车，那肯定是开车去呀——毕竟车得过去才能洗嘛。"

长文本能力方面，我们向 Qwen3.6-Max-Preview 甩了一篇复杂的大模型基础设施相关的论文，让它通俗地解释这篇论文的核心内容。这类任务不仅要求模型能捕捉长上下文中的核心信息，也考察了其逻辑理解与语境转换能力。

拿到任务后，Qwen3.6-Max-Preview 决定用交通调度的类比来拆解这篇论文的核心思想。它的几个类比都较为准确，也抓住了论文提出的核心问题与解决思路，用词中没有堆砌原文的大量术语，而是做了解释，让非技术背景的读者也能理解这篇论文的内容。

结语：头部开源玩家，重新思考开源战略

目前，阿里已推出千问 3.6 系列的多个版本，包括 Qwen3.6-Max-Preview、Qwen3.6-Plus、Qwen3.6-Flash，并开源了 Qwen3.6-35B-A3B。值得注意的是，此前阿里旗下的 Max 系列模型（如 Qwen3-Max）也属于开源范畴。

从这一新模式来看，阿里似乎调整了其开源策略：仅将小尺寸模型开源，而将超大参数量或高性能版本保留为商用产品。

这种 " 开源小尺寸 + 商业化大尺寸 " 的混合模式，正逐渐成为许多大模型厂商的共同选择。它或许也代表着开源生态与商业利益之间的一次再平衡。

智东西

作者 | 陈骏达

编辑 | 心缘

与之前发布的 Qwen3.6-Plus 相比，Qwen3.6-Max-Preview 模型在智能体编程、世界知识和指令遵循方面均有明显可感的提升。

Qwen3.6-Plus 的结果基本没有可玩性，画面粗糙，暂时还没在这一任务中展现出从 0 到 1 完成项目的能力。

Qwen3.6-Max-Preview 还支持 preserve_thinking 功能，也就是在消息中保留所有前序轮次的思考内容。这一功能推荐用于智能体任务。

体验链接：https://chat.qwen.ai/

一、智能体编程能力有提升，实测能 one-shot 复刻 "macOS"

据阿里介绍，Qwen3.6-Max-Preview 最大的性能提升在于智能体编程能力。

案例 1：模拟 macOS 桌面环境

提示词：生成一个 macOS 桌面环境，包含文件管理、浏览器、笔记等核心功能。

使用过程中，能感觉到 Qwen3.6-Max-Preview 的 token 效率不错，没有浪费过多的 token 在无谓的反复思考和自我核验上，而是很快进行到正式的开发环节。

Qwen3.6-Max-Preview 用大概 3 分钟完成了原型的开发。其模拟出的 macOS 桌面效果逼真，交互方式与原版差异不大，浏览器功能也可以正常使用。

这两个模型的差异在于，Qwen3.6-Max-Preview 能胜任更复杂的项目，考虑全面，而 Plus 更适合快速做原型，在具体的细节实现上还没有完全做到位。

案例 2：打造 MarkDown 编辑器

提示词：

二、成功破解洗车难题，讲解复杂论文深入浅出

除了智能体编程能力之外，我们也对 Qwen3.6-Max-Preview 的其他能力维度做了考察。

比如，在逻辑推理方面，它可以看穿洗车店难题中的陷阱，直接给出判断：" 既然目的是洗车，那肯定是开车去呀——毕竟车得过去才能洗嘛。"

结语：头部开源玩家，重新思考开源战略

从这一新模式来看，阿里似乎调整了其开源策略：仅将小尺寸模型开源，而将超大参数量或高性能版本保留为商用产品。

这种 " 开源小尺寸 + 商业化大尺寸 " 的混合模式，正逐渐成为许多大模型厂商的共同选择。它或许也代表着开源生态与商业利益之间的一次再平衡。

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

Qwen3.6 超大杯来了！我用这个“半成品”模型，亲手造了一个 macOS 桌面

宙世代

一起剪

相关阅读

鸿蒙6杀入大众产品线，手机行业的「参数内卷」该到头了

最新评论

智东西

热门推荐

企业资讯