来源:环球市场播报
Anthropic 于周二正式发布 Claude Sonnet 5,这款中端模型在多项基准测试中性能接近旗舰 Opus 4.8,价格却低约 60%。此举正值该公司推进 IPO 进程,旨在以高性价比策略扩大企业市场份额。
Sonnet 5 在 SWE-bench Pro 智能体编程测试中得分 63.2%,高于前代 Sonnet 4.6 的 58.1%,逼近 Opus 4.8 的 69.2%。在 GDPval-AA v2 知识工作基准测试中,Sonnet 5 以 1618 分超越 Opus 4.8 的 1615 分。发布初期 API 定价为每百万输入 token 2 美元、每百万输出 token 10 美元,截至 8 月 31 日;优惠期后将调整为 3 美元和 15 美元,仍远低于 Opus 4.8 的 5 美元和 25 美元。
早期合作伙伴反馈积极。Cursor 联合创始人表示,Sonnet 5 能够 " 遵循计划、遵守规范,并以高效成本完成多步骤变更 "。Zapier 高级工程师称,此前模型 " 往往进行到一半就卡住 " 的两部分自动化任务,Sonnet 5 已能端到端完成。这种可靠性正是企业将 AI 从试点推向生产部署的关键。
安全方面,Sonnet 5 的幻觉和谄媚率低于前代,对恶意请求的拒绝能力更强。但在与 Mozilla 合作的 Firefox 漏洞评估中,其部分成功率为 13.2%,高于 Sonnet 4.6 的 8.8%,但远低于 Opus 4.8 的 68.8%。Anthropic 已默认启用实时网络安全防护。
此次发布恰逢 Anthropic 冲刺 IPO 的关键时期。公司于 6 月 1 日秘密提交 S-1 文件,5 月完成 650 亿美元 H 轮融资后估值达 9650 亿美元,年化营收已突破 470 亿美元。Sonnet 5 承担双重使命:为开发者提供高性价比产品,同时向公开市场证明其推动大规模 API 收入的能力。正如 PitchBook 分析师所言,2026 年 IPO 窗口 " 要么成为自互联网时代以来最具影响力的 IPO 周期,要么成为公开市场上关于叙事与基本面关系最昂贵的一课 "。