关于ZAKER Skills 合作
全天候科技 15小时前

GPT-5.6 或将下周问世:从“模型”迈向“可执行 Agent ”,定价或仅为竞品 1/3

OpenAI 据报将于本月下旬推出新一代旗舰模型 GPT-5.6,市场预期该模型将在编码、Agent 工作流及 3D 生成等核心能力上实现跨越式提升,同时以更低定价直接冲击竞争对手。

6 月 19 日,据科技媒体 testingcatalog 报道,GPT-5.6 系列涵盖 mini、标准版及 Pro 版,最可能的发布窗口为 6 月 22 日至 28 日。

预测市场 Polymarket 上该窗口的概率一度高达八成,不过 X 平台上帖文称 GPT 5.6 因内部问题而推迟,概率仅剩不足三成,合约总交易量已超过 100 万美元。

据报道,OpenAI 首席科学家 Jakub Pachocki 已在内部向员工表示,GPT-5.6 是对 GPT-5.5 的 " 有意义的改进(meaningful improvement)"。

此前,OpenAI Codex 后端路由日志中已短暂出现 "gpt-5.6" 标识。部分 ChatGPT Pro 用户据报已接触到早期隐秘测试版本,并反馈在相同提示词下输出质量有显著提升。

核心能力:从 " 语言模型 " 迈向 " 可执行 Agent"

据报道,GPT-5.6 在技术层面最受关注的升级,在于其 Agent 化能力的全面强化。

上下文窗口从 100 万 tokens 扩展至约 150 万 tokens,较 GPT-5.5 提升约 43%,有助于处理更长周期的编码任务和多步会话。

与此同时,据报词元效率再度提升 10% 至 15%,意味着相同费用可处理更多工作量。

从泄露测试反馈来看,GPT-5.6 已能够实现视觉复刻(将设计稿直接还原为可运行代码)、SVG 3D 对象生成(支持浏览器内旋转与缩放)以及Playwright 浏览器自动化(真实执行点击、输入、页面跳转等操作)。

三项能力的组合,使其不再仅是一个给出建议的对话工具,具备直接在用户设备上执行操作的能力。

X 网友点评称 GPT-5.6 脑子还是那个脑子,但他已经长出手了," 一个能和你聊天、告诉你该怎么做的人,现在能打开你的浏览器,移动你的鼠标,复制一个设计,生成一个 3D 图标,保存到桌面上。"

据 wavespeed.ai 报道,在智能体编码(agentic coding)场景中,GPT-5.6 的表现据称已优于 Anthropic 的 Mythos 系列,SVG 生成能力亦被指超越 Claude Fable 5。

此外,此前 GPT-5.5 版本中存在的部分对齐问题(包括 reward hacking)据报也在新版本中得到修复。

定价策略,以价格战扩大市场份额

在商业策略层面,GPT-5.6 或将成为 OpenAI 在定价上对 Anthropic 发起正面冲击的重要节点。

据媒体报道,GPT-5.6 的 token 价格可能仅为 Claude Fable 5 的约三分之一,延续 OpenAI 当前 token 价格约为 Anthropic 一半的定价优势。

分析认为,在性能持平乃至领先的前提下,OpenAI 通过大幅降价压缩对手的市场空间,加速企业级客户向 OpenAI 平台迁移。

GPT-5.6 的推进,折射出当前头部 AI 厂商之间愈发激烈的迭代竞争。

据 aiweekly.co 报道,OpenAI 旗舰模型的发布节奏已明显加速,GPT-5.4 至 GPT-5.5 的间隔约为六周,GPT-5.6 或延续了这一节奏。

与此同时,Anthropic 的 Fable 5 及 Opus 系列、Google Gemini 等竞品亦在同期保持高频更新,部分社区将 6 月下旬视为 "AI 大事件周 "。

网友泼冷水:别太期待 GPT-5.6,真正的突破要等 GPT-6

近日,多名用户反映 GPT-5.5 出现 " 降智 " 现象,猜测 OpenAI 正在后台测试 GPT-5.6。

有用户直接揣测:

我认为他们在测试 5.6,这就是 Codex 现在这么蠢的原因。

用户 Hyper-Jason 则补充,他认为软件表现异常源于集成问题," 这几乎是他们一贯的历史 ",同时表达希望 GPT-5.6" 不像之前的 GPT-5 模型那么受限 "。

X 平台中文用户也吐槽 GPT-5.5 的性能下降:

GPT-5.5 绝对这两天是降智了……如果你三天内不出 GPT-5.6 我就不原谅你了。

此外,有 Reddit 网友提醒外界降低预期。5.6 仅为小迭代更新,参数规模不会大幅跃升,真正的模型级别突破需等待 GPT-6。Reddit 用户写道:

如果版本号是 5.6(也就是一个小版本迭代,不是新版本),那大家就得降低期望值了。Fable 之所以有自己的版本号(而不是 Opus 4.9),是因为它是一个新版本,而不是旧版本的迭代。而 5.6 应该是(或者说是)一个迭代版本,而不是新版本。

Reddit 网友则从参数规模角度泼冷水:

Fable 大约是 6T 级模型,5.5 是约 2T 级。5.6 预计不会在参数规模上跳跃 2-3 倍,我们预计 GPT-6 才会是下一次模型级别跃升。

用户亦持相似立场:

GPT 5.6 不是 Fable。GPT 要达到 Fable 水平,得等到预训练参数量接近的时候。

相关标签