离职阿里后,前千问大模型负责人林俊旸的最新动态曝光了。
他的下一步,是创业。
具体公司还不知道名字,但据说种子轮目标估值已经高达20 亿美元(约 135 亿元人民币)。
根据 The Information 消息,高榕资本与红杉中国被曝就投资事宜与该实验室进行深入洽谈。

Qwen 负责人,还是太有含金量了。

林俊旸 2019 年加入阿里,早期研究方向集中在搜索、推荐场景下的自然语言处理和多模态建模。
2020 年起,他开始投身大规模预训练模型研究与部署。
此后,他深度参与 M6 等超大规模预训练模型工作。M6 是阿里早期最有代表性的多模态大模型项目之一。
2022 年以后,他转向通用大模型方向。
Qwen 项目成立后,林俊旸成为技术负责人,带队打造 Qwen 系列大语言与多模态模型,并主导开源工作。
Qwen 后来变成了阿里 AI 对外最清晰的技术名片之一。
它有不同尺寸的模型,有面向开发者的开源路线,也有持续更新的多模态、代码和轻量化模型版本。对开发者来说,Qwen 是真正能下载、能微调、能部署、能二次开发的实用模型。
这也是他创业备受关注的底层原因。
那么,林俊旸下一步到底想做什么?
在有具体消息之前,还可以从他离职后发的一篇长文寻找线索。
首篇长文给出线索:Agentic Thinking
林俊旸离职后的首篇长文,标题为《From "Reasoning" Thinking to "Agentic" Thinking》。
这是他对过去一年模型竞争的复盘,也像是下一阶段创业方向的技术宣言。

上一阶段的 AI 竞争,是让模型更会思考;下一阶段的竞争,是让模型为了行动而思考。
思考模型花更多推理算力,强化学习得到更稳定的反馈,数学、代码、逻辑等可验证任务成为核心训练场景。
但林俊旸认为,问题已经开始变了。
尤其是在代码和智能体工作流里,真正重要的是代码库导航、计划拆解、错误恢复、工具编排,以及长时间执行任务的质量。
这就引出全文核心概念:Agentic Thinking。
林俊旸把它定义为一种 " 为了行动而思考 " 的能力。它不只是让模型在回答前想更久,而是让模型在环境里行动、观察反馈、修正计划,再继续推进。
推理浪潮的第一阶段确立了一件重要的事:
当反馈信号可靠且基础设施能够支撑时,语言模型之上的 RL 可以产出质的飞跃式的认知能力。
更深层的转变是从推理式思考到智能体式思考:
从想得更久,到为了行动而想。训练的核心对象已经改变了——它变成了模型 + 环境的系统,或者更具体地说,是智能体和围绕它的编排框架。
这改变了哪些研究要素最重要:
模型架构和训练数据当然仍然重要,但环境设计、轨迹采样基础设施、评估器鲁棒性、以及多智能体之间的协调接口同样关键。
这也改变了 " 好的思考 " 的定义:
最有用的轨迹,是能在真实世界约束下维持有效行动的那个——而非最长或最醒目的那个。
这也改变了竞争优势的来源:
在推理时代,优势来自更好的 RL 算法、更强的反馈信号和更可扩展的训练流水线。
在智能体时代,优势将来自更好的环境、更紧密的训练 - 推理耦合、更强的编排工程,以及在模型的决策与这些决策产生的后果之间实现闭环的能力。
One More Thing
自林俊旸发长文探讨 Agentic Thinking 后,个人社交媒体账号就没在发声。
不过转发了一条持续学习基准测试的消息。
难道与创业方向相关?

[ 1 ] https://x.com/jingyanghk/status/2054450088400093359
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
中国 AIGC 产业峰会最新嘉宾阵容来了!
从 AI 最新架构到应用生态,从 AI 音乐、AI 漫剧、AI 浏览器再到世界模型、AI 硬件 ... 这一次,我们希望聚齐AI 赛道的实战派,百度、智谱、昆仑万维、模思智能、蚂蚁灵波都会来。了解详情
5 月 20 日,北京 · 金茂万丽酒店,@所有人,马上 AI 起来!
一键关注 点亮星标
科技前沿进展每日见