凤凰网科技讯 3 月 26 日,前阿里千问技术负责人林俊旸离职后发表长文,明确指出 AI 大模型的发展路线正在经历重大跨越,核心竞争焦点正从 " 推理型思考(Reasoning Thinking)" 全面转向 " 智能体思考(Agentic Thinking)"。文章复盘了以 OpenAI o1 和 DeepSeek-R1 为代表的第一波推理模型浪潮,指出这标志着行业从扩大预训练规模,正式步入扩大强化学习(RL)后训练规模的新阶段,数学与代码等可验证领域成为优化模型正确性的核心试金石。

针对下一阶段的技术演进,林俊旸断言,单纯延长模型内部推理轨迹的时代即将过去,未来的主导将是在与环境交互中持续迭代计划的智能体思考。他指出,智能体强化学习(Agentic RL)彻底改变了原有的技术栈要求,训练与推理必须实现更纯粹的解耦。随着大模型获得搜索、代码执行等工具权限,防范奖励作弊(Reward Hacking)将成为极其危险的挑战。未来的行业护城河将不再局限于算法本身,而是转移至高质量环境设计、防作弊协议以及多智能体协同编排等系统工程能力上。
本文来自和讯财经,更多精彩资讯请下载 " 和讯财经 "APP