关于ZAKER 合作
钛媒体 50分钟前

通义巨震:周靖人收权,林俊旸放手?

文 | 象先志

林俊旸宣布离开千问,这个事非常突然,本来还在看几位长老陪马老师溜园的新闻。

目前确定的信息是,林俊旸是昨天下午提的离职,阿里那边刚开始走流程。同一天,Qwen 的后训练负责人郁博文也正式离职,他的工作由年初从谷歌挖过来的 zhou 姓高管接任。

林俊旸去年刚晋升,是阿里最年轻的 P10,外界担心他突然离开给 Qwen 后续模型研发和更新带来不确定性。

这种担心不太必要。

林俊旸和郁博文等固然是 Qwen 系列模型的核心功臣,大模型领域单兵能力的重要性也确实相比过去大幅提升,但阿里整个 AI 研发体系不可能只依赖于两三个重要的技术骨干。

我不相信 Qwen 因为林俊旸离开就会彻底陨落,就像我不太相信鹅厂招来姚顺雨就能扭转局面一样。

1

先梳理下林俊旸和郁博文等人离开的原因。

有传言是说,阿里内部对现有的开源模式有分歧,觉得开源的成本投入不划算,或者认为开源影响了阿里云卖自己的 API。

这个说法不合理。我倒不是说阿里内部没有这种讨论,而是因为林俊旸是做模型基础研发,模型开源还是闭源,都不影响他工作结果的价值。就算阿里突然全面转向闭源,模型研发照样得有人带,后训练这些照样得继续做。

按照这个逻辑,唯一能把这两件事统一起来的,就是林俊旸确实有不可妥协的开源理想。给个 P10 又怎样,只要 Qwen 转向闭源,劳资立马撂挑子不干。

这种可能性有,但确实很小。不只是林俊旸走了,郁博文这些也走了,不可能说这些人都要当 Richard Stallman 吧。

而且综合各方面的消息,林俊旸的离开比较突然。

说是昨天下午通义开了场内部会议,会上产生分歧,林俊旸当场离开,几小时后就在 X 平台上宣布了离职的消息。林俊旸级别高,阿里如果真的想调整开源战略,这种业务负责人多少有点提前的吹风和讨论。

所以林俊旸突然离开,最大可能还是跟通义最近的组织调整有关。

而这个组织调整的原因,应该不是直接出于开源和闭源的战略有重大变化。今天阿里算是全球模型开源的扛把子,

HF 上下载量一直保持领先。但阿里开源的整体状态是三角形:中腰部模型能力很强,但参数量最大的最强模型表现是有差距的。

阿里如果只是想做 B 端,通过云服务卖 API,这个问题还没有那么关键,因为开源跟闭源是两个赛道。然而阿里从去年 11 月开始,已经明牌要参与这轮 AI 入口争夺。

因为千问 APP 起步晚了对手一年多,需要投入更多资源追上对手,整个春节档阿里为千问投入的预算也是最多的。这些措施取得了明显效果,千问 APP 用户快速增长,目前已经甩开元宝,但仍然低于豆包。

从纯 B 端向 B/C 两端兼顾的转向,对 Qwen 的模型能力提出了更高的要求。集团层面,Qwen 也得更多配合千问 APP 的产品团队,因为后者当下是集团最大的优先级。

林俊旸直接负责的 Qwen 团队隶属于通义实验室,后者由阿里云 CTO 周靖人负责。

通义正计划将 Qwen 团队分拆,从涵盖不同训练流程和模态的 " 垂直整合 " 体系,转变成预训练、后训练、文本、多模态等一个个分开的水平分工团队,这些团队仍隶属通义实验室。

晚点报道提到,林俊旸并不认可这种分开拆散团队的做法,他认为预训练、后训练,乃至 Infra 和训练团队应该更紧密地结合和沟通。

这个描述其实非常有意思,值得推敲一番。

预训练、后训练这些团队本身就是各自存在的,为什么在 Qwen 下面就是垂直整合,分拆过后就是水平分工呢?整个通义实验室依旧在周靖人博士的领导之下,各团队之间的拉通对齐怎么就不能做继续做呢?

按照互联网公司喜欢讲的管理学模型,甚至可以说这让组织结构进一步扁平化,有利于提高信息传递的效率。

当然这只是理论上,而理论跟实际往往有相当的距离。林俊旸和 Qwen 团队已经经过了长时期磨合,保持着高强度产出,做这种分拆一定意味着大量的组织摩擦和不确定性。

2

这些动作无法避免的后果是,林俊旸的 " 势力范围 " 在缩减。

他领导的 Qwen 团队从去年中开始组建自己的 Infra 团队,代替原来阿里云的人工智能平台 PAI。也就是说,Qwen 团队在逐步补齐所有 LLM 训练需要的基础设施。

OpenAI infra 负责人翁家翌前段时间提到,真正拉开 openai 和 meta 差距的就在于 infra 上。他认为这其中的关键在于谁的 RL infa BUG 相对更少,训练迭代更快。

所以可以推测,林俊旸对于由阿里云 PAI 来负责通义各业务的 infra 不满意,因此要单独组建 infra 团队。

但阿里内部对 Qwen 团队的投入产生评价本身就是有分歧的,这种团队扩充或许进一步加剧了这种分歧,拉大了集团高管跟林俊旸团队的张力。据说甚至有高管对除夕夜亮相发布的 Qwen-3.5 并不完全满意,称其是一个 " 半成品 "。

最终的局面就变成,一边是林俊旸和 Qwen 团队感觉受到了集团的资源掣肘,另一边则是集团对 Qwen 表现也不满意,要大调组织架构,提升产出并且加强跟 C 端产品的闭环。

今天还流出一份吴妈给通义团队开会的摘要,信息量很多但不保真。

看起来从谷歌挖过来的 zhou 姓高管,是林俊旸离职的导火索。zhou 担心自己融不进 Qwen 团队,所以要求挂到周靖人下面。晚点报道也提到,zhou 确实是直接向周靖人汇报。

这个细节如果属实,那基本意味着 zhou 跟林早就是要二选一。

因为 zhou 是搞后训练的,搞后训练的跟统筹模型研发的不对付,还向顶头上司 " 告御状 ",暗示对方要排挤我,这后面抬头不见低头见的,哪里还有合作的可能。

既然最后 zhou 的诉求得到了满足,成功入职了,就说明周靖人和集团当时已经在两个人之间做出了选择。

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容