关于ZAKER Skills 合作
IPO早知道 1小时前

小米集团罗福莉:Fable 5 是中间状态的产物,模型的进化远未结束

语言模型和世界模型并驾齐驱,但现阶段语言模型走得更快。

本文为 IPO 早知道原创

作者|SY

微信公众号|ipozaozhidao

6 月 12 日举行的 2026 智源大会《重构世界——大模型巅峰对话》环节,在对 Anthropic 于近期发布的 Claude Fable 5 进行评价时,小米集团 MiMo 负责人罗福莉如此表示。

Anthropic 于美东时间 6 月 9 日发布的 Claude Fable 5,几乎所有测试基准上都达到业内领先水平,尤其擅长长周期、多步骤和高复杂度任务。Stripe 实测显示,在 5000 万行 Ruby 代码库中,Fable 5 一天可完成原本一个团队两个月才能完成的代码迁移工作。

Fable 5 模型实现了编程能力及 Agent 能力大幅跃升,但罗福莉认为它仍是一个中间状态的产物,主要基于以下三个维度:

首先,参数规模上看,当前的参数量是目前最强和最大的开源模型的几倍,如在预训练数量级上做了几倍的 scaling;

其次,在 Test-Time Scaling 和强化学习方面,也有非常大的算力投入;

再次,从 Chat 迈入 Agent 时代,训练数据也发生了变化。模型训练正在从互联网文本数据,扩展到人与 Agent 共同产生的合成数据,数据规模进入新的量级。原来获得整个文本数据,可能 token 在 40T-80T 的范围,如今数据规模又迈上了一个新台阶。

"Fable 5 是一个大模型很自然地在预训练时的参数规模、数据甚至 Agent 的合成数据,以及后训练跟强化学习的结合的三个维度,做了一个非常自然和外延的扩展,一个中间模型的产物。" 罗福莉总结道。

随着基座模型以及智能体技术的发展,自进化常常被业界热议。近日,Anthropic 发布了一篇题为《When AI Builds Itself》的博客,提出了递归自我改进的说法,指出 AI 系统全自动设计并研发下一代 AI 系统的可能性。

当被问及如何看待模型的自进化时,罗福莉指出,今天的顶尖模型已经从执行层解决一些抽象问题,而上一代顶尖模型的上限是在人类指令清晰的情况下才能做出非常好的执行。

她列举了模型在科研流程中使用的案例。从提出假设到设计实验,再到动手执行,验证结果,与同行交流并修正观点,这是一个完整的研究路径。现在的大模型已经能够设计合理的验证指标、验证自身执行结果的准确性、规划实验的整体流程。

罗福莉指出,模型与顶尖研究员的差距主要是在于提出假设或提出值得实验的问题的能力,说到底这是一种研究的 taste,包括早期时叫停一些没有意义的研究方向。而且,这种差距正在被更强的模型,加上一套更好的 recursive improvement 配置系统,慢慢外延到这些边界上。

那么,如果 AI 的自进化能力持续增强,它会以怎样的路径重构世界?是先重构数字世界再进入物理世界,还是在物理世界重新理解基模?

罗福莉认为,语言模型和世界模型并驾齐驱,但现阶段语言模型走得更快,因为我们能够更好地从 Agent 环境中还原智能诞生的场景。

" 我们用一套能够驱动模型发挥更高上限的 Agent 系统,叠加模型,让它在环境里自由探索,从而设计出更精准的激励体系来驱动模型自我提升。" 她解释称,这条路径在数字世界正在发生。

在罗福莉看来,世界模型层面还未看到一个非常高效的视觉模型诞生。首先,应该有一个高效的生成器基础架构,再叠加一套能触达现实复杂任务的脚手架式的 Agent 系统,最后 scaling 整个范式,而语言模型会先在这条路上探索得更清楚。

在被要求给当下的年轻人一些人生建议时,罗福莉说," 保持自己的探索欲和好奇心,更极致地去使用 AI 最新的大模型,在这个过程中进行大量的试错,培养自己独特的判断力和某种程度上的研究的 taste。"

本文由公众号 IPO 早知道(ID:ipozaozhidao)原创撰写,如需转载请联系 C 叔↓↓↓

小马智行地平线文远知行

蜜雪冰城古茗沪上阿姨

极智嘉云迹科技特斯联

相关标签
ai
IPO早知道

IPO早知道

IPO情报专家

订阅

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容