
Anthropic 宣布,公司已完成 H 轮融资,融资金额达 650 亿美元,投后估值为 9650 亿美元。
这笔融资将被 Anthropic 用来继续研发,同时扩大算力产能,满足现在市场对 Claude 越来越大的需求。


在 Claude Code 2.1.154 版本中,输入 /model 后的模型选择菜单里,Opus 一栏已经更新为 Opus 4.8。



Opus 4.8 更新速览
根据 Anthropic 官方介绍,Opus 4.8 具有更敏锐的判断力、对自身进步的更诚实的态度,以及更长时间独立工作的能力。
重要的是,价格保持不变。
常规价格仍是输入 5 美元 / 百万 token、输出 25 美元 / 百万 token;Fast mode 价格为输入 10 美元 / 百万 token、输出 50 美元 / 百万 token。
Opus 4.8 的 Fast mode 速度大约是标准模式的 2.5 倍;同时,Fast mode 这次降价后,价格约为此前 Fast mode 的三分之一。

官方在新闻稿末尾是这么写的:"Opus 4.8 相比 Opus 4.7,并没有很夸张的提升,更多的是那种用户真正用起来后,才能感受到的细节升级。"
Anthropic 还提到,公司正在开发一类成本更低、但能力接近 Opus 的模型。同时也计划推出比 Opus 更强的新类型模型,就是公开的秘密—— Mythos。

Anthropic 这次尤其强调,Opus 4.8 变得更诚实了。
所谓诚实,不只是少胡说,而是模型在自己拿不准的时候,更愿意把不确定性说出来;在没有足够证据时,也更少强行给出一个看似确定的结论。
Anthropic 称,在内部评测中,Opus 4.8 如果写出了有问题的代码,更可能主动指出问题,而不是假装一切正常。相比上一代,它 " 发现自己代码缺陷却不说 " 的情况大约减少了四分之三。

这延续了 Anthropic 最近一贯的姿态。无论是强调 Opus 4.8 更愿意承认不确定性,还是回应《人性的伟大之处》里关于 AI 与人类尊严的讨论,Anthropic 都在反复传递同一个信号:模型越能干,越不能只是听话和自信,它必须知道边界,承认不确定性,并且尽量维护用户的真实利益。
这种叙事可以增强用户对于 Anthropic 模型的信任,促进企业合作,也有助于 Anthropic 为未来 IPO 铺路。
Opus 4.8 发布的同时,Anthropic 还推出了几项功能更新,其中最重要的是动态工作流,Anthropic 专门发了一篇文章来介绍。

按照 Anthropic 的说法,它可以让 Claude Code 处理更大规模的问题。Claude 会先规划工作,再在一个会话里运行数百个并行 subagents,最后在向用户汇报前验证输出。配合 Opus 4.8,这些 agents 可以运行更久,更适合代码迁移、全库排查、长期重构这类需要持续推进的异步工作流。
官方举的例子是,Claude Code 现在可以完成跨数十万行代码库的迁移任务,从启动一直推进到合并,并使用项目原有的测试套件来检查结果。

Claude Code 里过去已经有类似的 effort 控制,用 /effort 可以调不同的思考强度,现在 claude.ai 和 Claude Cowork 现在也有了这个控制项,用户可以在模型选择器旁边直接调 Claude 对一次回答投入多少 effort。
低 effort 的情况下 Claude 就回得更快、消耗更少;高 effort 就是让它多花一些 token,把问题想得更细,更适合那种复杂的任务。
在 Claude Code 里,Opus 4.8 默认使用高 effort 模式。Anthropic 的意思是,这样能在质量和速度之间取得比较好的平衡。做代码任务时,它的 token 消耗和 Opus 4.7 默认模式差不多,但完成效果更好。
还有一个更偏开发者的小更新,Messages API 现在支持在 messages 数组里插入 system 条目了。你可以在任务执行过程中更新 Claude 的系统指令,不用打断 prompt 缓存,非常适合长流程任务。
动态工作流
比起模型性能,本次更新的重中之重,就是前文提到的 Claude Code 的动态工作流。

而这,就是动态工作流的核心。
以前你让 Claude Code 做一个复杂任务,它是用一个主 Agent,一步步读代码、改代码、跑测试、再修。
问题是,大型工程任务往往太大。一个 bug 可能关联几十个文件,一次迁移可能要改几百个文件。单个 Agent 一条线往下跑,容易漏东西,也容易中途跑偏。
动态工作流要做的事情就是调度,类似于客户经理。它不干活,但是它安排合适的人干活。
Claude 先把你的任务拆成一套工作流,然后自动拉起几十到几百个并行的子 Agent。每个子 Agent 负责一个子任务,比如扫某个模块、验证某个结论、找反例、跑测试这些。
最后 Claude 再把这些结果汇总、交叉验证,给你一个统一答案。
它的核心不是让一个 Agent 更聪明,是让 Claude 自动组织一群 Agent 一起干活。
官方举的例子是 Bun 从 Zig 到 Rust 的迁移试验,动态工作流参与了约 75 万行 Rust 代码迁移,11 天内从首次提交推进到合并,并让 99.8% 的既有测试套件通过。
但与之相对的,成本也增加了。官方特意提醒,动态工作流会明显消耗更多 token,第一次触发时会让用户确认;Enterprise 管理员也可以选择直接禁用。
4.7 到 4.8,只相隔了 42 天
如果按公开发布时间算,Opus 4.5 的发布日期是 2025 年 11 月 24 日,Opus 4.6 是 2026 年 2 月 5 日,两者相隔 73 天;Opus 4.7 是 2026 年 4 月 16 日,距离 4.6 相隔 70 天;Opus 4.8 是 2026 年 5 月 28 日,距离 4.7 只有 42 天。
为什么这么快?
网上普遍认为是 4.7 没有达到用户预期。
Anthropic 发布 4.7 的时候说,它能把更难的编程任务交给模型,并且模型还能在汇报前验证结果。
但不少用户反馈称,4.7 只是会简单搜索一下就直接下结论,也没有真正地交叉验证结果。AMD AI 负责人丝黛拉 · 劳伦佐(Stella Laurenzo)表示,Claude Code 在使用 4.7 做大型工程时,很容易跑偏。
如果只是模型性能没达标也就算了,问题是官方自己也承认,4.7 的 tokenizer 会让同样输入变成约 1.0 到 1.35 倍 token,同时高 effort 下会花更多 token。
等于说钱多花了,结果没有提升,甚至还下降了。
从官方和早期测试者的说法看,4.8 至少瞄准了几个 4.7 的痛点,比如工具调用、长任务稳定性、代码缺陷自检、回复噪音,以及在不确定时硬撑结论的问题。
但要说 " 完全解决 ",还太早,还得等后续各种大型工程项目的反馈结果出来才能看清楚。
关键在于,Anthropic 现在可不是追赶者了,它是领跑者。
就在 4.8 发布的前一天,外媒报道称,Anthropic 目前的收入很可能已经比 OpenAI 至少高出 35%。
Anthropic 年化收入接近 450 亿美元,OpenAI 约为 330 亿美元。虽然 ARR 不等同于最终利润,但足以改变市场叙事。
这两家公司都是准备在 2026 年下半年 IPO 的,如果 Anthropic 先过会,那 OpenAI 的故事就不好讲了。
这也让 Opus 4.8 多了一层含义。它是在给资本市场递材料,证明 4.7 虽然不行,但是 Anthropic 能立马推出新版本,以支撑自己超高的估值和收入。
本文来自微信公众号:字母 AI,作者:袁心玥、苗正