APP下载

关于ZAKER

合作

和讯网 7小时前

林俊旸阿里离职后发长文 : 大模型演进路线正从“推理型”全面转向“智能体”

凤凰网科技讯 3 月 26 日，前阿里千问技术负责人林俊旸离职后发表长文，明确指出 AI 大模型的发展路线正在经历重大跨越，核心竞争焦点正从 " 推理型思考（Reasoning Thinking）" 全面转向 " 智能体思考（Agentic Thinking）"。文章复盘了以 OpenAI o1 和 DeepSeek-R1 为代表的第一波推理模型浪潮，指出这标志着行业从扩大预训练规模，正式步入扩大强化学习（RL）后训练规模的新阶段，数学与代码等可验证领域成为优化模型正确性的核心试金石。

林俊旸在文中深度剖析了行业内尝试 " 融合思考与指令模式 " 所面临的落地困境。他透露，千问团队曾试图通过 Qwen3 打造支持混合思考模式的系统，但在实际推进中发现，指令模型追求极简与低延迟，而思考模型需要消耗大量 Token 进行复杂推演，两者在数据分布和行为目标上存在根本冲突。若数据筛选不当，强行融合往往会导致模型在两端表现平庸。基于商业客户对高吞吐量和低成本的真实需求，Qwen 在后续的 2507 版本中选择推出了分离的 30B 和 235B 指令与思考变体。与之形成对比的是，Anthropic 和 DeepSeek 等厂商则继续在统合推理与工具调用的混合架构上进行探索。

针对下一阶段的技术演进，林俊旸断言，单纯延长模型内部推理轨迹的时代即将过去，未来的主导将是在与环境交互中持续迭代计划的智能体思考。他指出，智能体强化学习（Agentic RL）彻底改变了原有的技术栈要求，训练与推理必须实现更纯粹的解耦。随着大模型获得搜索、代码执行等工具权限，防范奖励作弊（Reward Hacking）将成为极其危险的挑战。未来的行业护城河将不再局限于算法本身，而是转移至高质量环境设计、防作弊协议以及多智能体协同编排等系统工程能力上。

本文来自和讯财经，更多精彩资讯请下载 " 和讯财经 "APP

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

企业资讯

查看更多内容

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

林俊旸阿里离职后发长文 : 大模型演进路线正从“推理型”全面转向“智能体”

宙世代

一起剪

相关阅读

从生态到人才 科技园区加快探寻产业培育新范式

原材料短缺 韩国商店限购垃圾袋

推行长期护理保险制度 破解失能照护难题

嘲讽用户是狗！罗技就侮辱性广告道歉：授权商员工擅自发布

再见，8人间宿舍

全球通星动嘉年华春日壕礼，承包你一整个3月快乐～

最新评论

企业资讯

热门推荐

企业资讯

热门订阅 换一批

局市

医线Insight

GMIF创新观察

AI价值官

挖贝网

银莕财经

中保新知

从生态到人才科技园区加快探寻产业培育新范式

原材料短缺韩国商店限购垃圾袋

推行长期护理保险制度破解失能照护难题

热门订阅换一批