关于ZAKER 合作
硅星人 1小时前

Qwen 和钉钉,无招和俊旸

为什么一开始被宽容和鼓励的,总在最好的时候被打破?

1. 我觉得林俊旸跟其他 AI 基础模型的研究人员最不一样的地方,是他的应用语言学学科背景。应用语言学的重要分支是计算语言学。计算机背景的人往往视语言为单纯的序列问题,但语言学训练会让人理解语言远不止于此:句法结构、语义组合性、语用推理、指代消解等,逐一对应着大语言模型 " 涌现 " 过程中展现的能力。这也意味着懂语言学的人在设计评估基准、诊断模型缺陷时,能看到纯工程视角看不到的东西。随着大模型从 " 能用 " 走向 " 可靠 " 和 " 可控 ",语言学的价值将越来越大——它们指向的是语言最复杂的现象。俊旸的学科背景,在 Qwen 的模型训练和评估过程当中应该是发挥了相关作用的。

2. 我非常喜欢林俊旸。聪明、直率又有点 mean 的人我都喜欢。跟他同台和连线直播的几次经历简直不要太愉快:不会滔滔不绝,也不会惜字如金,表达克制、准确、优雅,偶尔毒舌。好几次从 panel 下来,他第一句话就是:" 你提的问题够骚的啊 "。这个评价我喜欢。

3. 如果检索过林俊旸参与的学术论文,也能发现一条非常清晰的学术品味脉络。他的标志性工作之一是 OFA,一个与任务和模态无关的统一预训练框架,以及 Chinese CLIP(中文跨模态检索和表征生成)。它们的核心思路都是不需要为每个任务或模态搭建专门的脚手架,而是用一个足够通用的框架把所有东西装进去。这其实是非常语言学的思维,即寻找一套符号系统的底层生成语法。

4. 另一方面,俊旸参与发表的几乎没有纯理论探索型的论文,而是每一篇论文都伴随着可用的开源代码和模型。这恰恰是当前学术界和工业界最欢迎的论文格式与论文品位。Qwen 系列能够在 Hugging Face 上积累超过 6 亿次下载和超过 17 万个衍生模型,与这种作为 default setting 的学术贡献方法是密切相关的。

5. 之所以说这么多,我其实想表达的是:作为 Qwen 在相当一段时间内最重要的核心开发者和贡献者之一,林俊旸的一系列工作,无论是学术贡献、模型发布还是与开源社区的关系建设,都对今天 Qwen 在全球大语言模型竞技场上的江湖地位,至关重要。他是那个让 Qwen 在全球 AI 社区被看到、被关注、被重视的关键先生。我不敢说他是 Qwen 的 " 灵魂人物 ",但不可或缺。

6. 在俊旸闪电离职,处在舆论的风口浪尖。一些人把他推到了 " 千问之父 " 的高度,认为他与 Sam Altman、Dario Amodei 和 Demis Hassabis 的地位相当,这是捧杀,也不符合事实。我过去就跟俊旸的同事开玩笑说过俊旸是通义的 Jason Wei,他的同事哈哈大笑说 yes he is。现在,我觉得,他更像是通义的 Andrej Kaparthy。

7. 无论 Jason Wei 还是 Andrej Kaparthy,在 OpenAI 走入公众视野的关键阶段,角色都是独树一帜且不可替代的:他们在社交媒体和 AI 社区和人们打成一片,时而卖萌耍宝,更多是倾听用户的反馈,跟开发者和关键用户互动,说人话,拉近了 OpenAI 与公众与开发者的距离,为 OpenAI 赢得了口碑和路人缘。你以为这活儿谁都能干?反正这俩人离开之后,OpenAI 就没人对外 " 说人话 " 了。

8. 俊旸对 Qwen 的意义也在这儿。除了模型研发,他做的是 Qwen 作为一个 AI 团队最有 " 活人感 " 的工作。对开源社区来说,这种 " 活人感 " 更加重要。开源社区是有英雄情结的,对那些积极贡献成果、认真听取反馈、持续迭代成果的人有着天然本能的好感,视他们为偶像。

9. 更重要的是:与 OpenAI 和 Google 不同,阿里巴巴的一众高管,包括阿里云的关键负责人,在全球 AI 生态是缺席和不可见的。俊旸几乎是外界与 Qwen 打交道的唯一面孔,是 Qwen 在全球 AI 社区几乎唯一鲜活的碳基因子。他不是要喧谁的宾夺谁的主,而是这活儿总得有人干,也不是谁都能干。他在社交平台和开源社区的活跃,让阿里巴巴在全世界的 AI 存在感,省下了 30 亿的红包。

10. 从全球 AI 生态站位的角度,Qwen 的功业是有目共睹的,俊旸的存在感也恰如其分。但在中国这个厮杀更残酷的大语言模型版图上,在 Qwen 的口碑效应,必须与 API 调用量和阿里云的 token 消耗量等关键 KPI 绑定的时候,事情就起了变化。

11. 当 Qwen 不再是通义实验室的 Qwen,而是阿里巴巴的 Qwen 之后,Qwen 的角色就必须由实验室伊甸园里的开源玫瑰,变成巨头冲锋陷阵的基础设施甚至印钞机。没谁能在实验室和战壕里同时活得优雅。OpenAI 不行,DeepSeek 不需要,Google 可能能打破这个魔咒,但还得再看。

12. 而 Qwen 在硅谷 AI 生态的震撼效应、在全球社区和开发者群体的极佳口碑,在电商、外卖、打车、公有云和私有云市场厮杀过的阿里特种部队看来,什么都不是。

13. 我知道的情况是:通义万象(Wan)的图像生成模型 API,在阿里云上卖得不错。可 Qwen 的 API 调用量就是起不来。Qwen 的小尺寸模型很受开发者欢迎,但主要靠免费下载,赚的是口碑和品牌,不能体现在实际产生收入的 API 消耗上,大尺寸模型的商业用户少,收不到钱,阿里云的销售就摘不到桃子。备受中国人民讨厌的 Anthropic CEO Dario Amodei 说他们企业级商战只看得到 OpenAI 抢单,看不到 Qwen 的存在,这话倒也不假。

14. 国内也一样。字节跳动天天讲火山引擎 token 消耗量全国公有云第一,形成了一套 token 经济学,豆包的模型能力在火山引擎上卖得风生水起,但 Qwen 就没给阿里云带来 token 经济学。Qwen 是天然亲近开发者的,甚至愿意为了开发者的呼声彻底改变技术路径—— 俊旸的团队从 Qwen 2.5 之前的 dense Transformer 全面转向 MoE,就是响应社区的呼声,也成就了 Qwen 3 在开发者社区的极佳口碑。但他们在服务阿里内部 " 客户 " 的时候好像就没那么慷慨,磕绊也比较多。

15. 据说俊旸带领的 Qwen 团队有很鲜明的 " 厌蠢 " 气质。我理解这不是一种基于智力优越感的碾压,而是基于对非技术第一性出发的需求和命令的本能不耐烦,甚至消极反抗。" 技术决定一切 " 从来不是阿里的基因,达摩院也不是 DeepMind。冲突不难想象,而且很可能的结果是:双方都感觉受到了冒犯。

16. 不过讲真,Qwen 团队这种 " 特立独行 " 的气质,我是深表理解的。与字节的豆包和 Seed 模型倍享资源优待不同,Qwen 从一开始就没得到过来自阿里的最好的资源。缺卡和算力稀松平常,一直到今天都没解决,这个问题也在林俊旸宣布离职之后的内部 All hands meeting 上被摆到了桌面。Qwen 是在比竞争对手资源少了 N 倍的情况下,做到了今天这个样子。

17. 记得 2024 年 9 月的 " 云栖大会 "。上午主会场,聚光灯给到了阿里巴巴投资的大模型明星公司——月之暗面、阶跃星辰和生数科技,Qwen 甚至没有亮相的机会。当时阿里各个部门都在训自己的模型,都在争抢芯片和云的算力资源,很多业务单元摆明了不想用 Qwen 模型。Qwen 号称阿里 AI 的战略项目,但从资源上真的都看不出来。如果在字节,这是不可想象的。

18. 但也就是在 Qwen 在云栖大会上备受冷遇的 2024 年 9 月,Qwen 在 Google Trends 的曲线开始上扬,12 月上扬趋势变得极其陡峭,大概率与当月 Qwen 开放部分权重相关。Qwen 在 Google Trends 的曲线最高点在 2025 年 2 月,借了一把 DeepSeek R1 开源的势,但此后也一直居高不下,已成开源明星气象。

19. 从 Qwen 2022 年底立项,我就密切关注它的进展。但到了 2025 年初,我更愿意观察阿里从集团层面会怎么对待 Qwen ——这个在内部被冷遇到极点时骤然翻盘的大语言模型成果,未来能拿到什么资源,话语权能不能提升。不是有人说 " 西谷东阿 " 么,Qwen 在阿里内部的话语权,总该跟 Gemini 在 Google 有一拼吧。

20. 不出所料,等来了林俊旸的升职,周靖人成为阿里合伙人,也等来了 Qwen 成为阿里 AI 的基础设施。但我没料到的是:Qwen 很快就被用来点外卖和订机票,配发春节 30 亿的红包。我觉得这真的很好,但我自己没能说服自己的是:让 14 亿中国人每人都点上一杯奶茶,跟成为全球 4 亿家中小企业的 AI 底座,哪个更重要,更有意义,对中国 AI 的全球竞争力提升更有助力?

21. 当然我更没料到:Qwen ——现在已经 " 大一统 " 为千问,战略地位看似提升了,成了公司 AI 底座,但主线任务变成了支持通义 APP,以及电商外卖等传统核心业务,而不再是全球 AI 开源生态的领导者。我认为这件事迟早得发生,但应该再晚一点。Qwen 和 Gemini 都是第二代逆风翻盘的,但 Google 也有云业务,更有广告和其它业务,但它也没那么着急啊。

22. 我倒是料到了林俊旸会离职。从去年 10 月千问大一统开始,我就觉得他呆不住了,他肯定比谁都清楚,桃子要被摘走了。1 月在清华大学 AGI-Next 前沿峰会上,他已经很放飞自我了,不但暗怼了姚顺雨,还话里话外透露阿里给 Qwen 的资源依然不够,只言片语不提千问 APP,只讲 qwen.com。我甚至觉得他出席这场活动本身都是率性而为,因为毕竟从 2024 年 9 月 Qwen 在全球起势之后,我就再也没法喊他来参加我的论坛或直播了,不是他不想讲,而是 " 出不来了 ",外部的活动谁都叫不出来。更准确地说,从去年 12 月他飞到圣地亚哥参加 NIPS 我就觉得事情起了变化,要知道公司一直是 " 保护 " 他,不让他去美国的。

23. 但一条推特就挂印离去,还是我万万没想到的。我知道林同学有性格,但这么有性格真是吓到我了。也许他就是在等着内部跟他摊牌的那一天。他自己肯定知道 Qwen 对千问 APP 的支持不够,给阿里云带来的 token 收入也有限,但他肯定是自己不想再努力了。

24. 俊旸眼下的不愿意妥协的状态,以及 Qwen 的走向,和阿里巴巴的内在张力,都跟阿里巴巴历史上的一幕惊人的相似:2020 年的钉钉," 灵魂人物 " 无招被调离,旋即在第二年出走。Qwen 和钉钉在阿里的体系内,居然拿到了完全一致的上半场脚本。

25. 钉钉一开始也是在内部要不到资源,不被看好的项目。无招是在 " 来往 " 失败之后被发配去搞钉钉的,带着团队躲到湖畔花园,靠 "CEO 特别经费 " 度日,钉钉一开始推出来连内部都不想用。跟无招相比,俊旸除了出身更 " 清白 ",没有在内部被打上 " 运气不好 " 和 "loser" 的标签之外,其他地方简直不要太像:一开始表面上 Qwen 是战略级项目,其实真的没什么资源,做出来其它部门也不想用,得先从外部打开空间。

26. 但昨日的钉钉和今日的 Qwen,又确实在内部得到了恰到好处又适可而止的保护,让它们至少能维持运营,不至于被其它团队瓦解和拆分。当初 " 保护 " 了钉钉的,是马老师和曾担任 CEO 的陆兆禧;而过去三年一直保护了 Qwen 独立性的,坦率地说,除了靖人,也有现任 CEO 吴泳铭。甚至 Qwen 走开源路线,也不是靖人和俊旸能最终拍板的,还得是吴妈。尽管一度分配到的资源和内部关注度有限,但没有这些底线的支持和定调,Qwen 也等不到它被全球 AI 生态看到的那天。

27. 钉钉跟 Qwen " 独来独往 " 的性格很相似,而这也是它们在被底线保护,同时又缺少资源和内部更多支持的情形下自我养成的。钉钉在开拓阿里擅长的电商商家客户受挫后,转向了连 IT 系统都没有的中国中小型企业,刻意绕开了阿里资源最擅长的领域,居然打开了缺口。Qwen 的情况也是一样,它的核心阵地是 Hugging Face、GitHub 和 X,面对的是开源社区和全球 AI 开发者,这与阿里的核心资源甚至阿里云的关键客户群体风马牛不相及,但 Qwen 的影响力,正是在阿里的体系之外,靠开源社区的口碑,一点点攒起来的。甚至连 Qwen 的吉祥物 ,那只卡皮巴拉,俊旸都不愿意 " 劳动 " 阿里自己的设计师,而是在淘宝上花 50 块钱找人设计的。

28. 作为钉钉和 Qwen 的关键人物,生于 1972 年的无招和生于 1993 年的林俊旸,尽管岁数差了一代人的光景,很多特质却惊人的相似:特立独行、直率、坦诚,爱得罪人,有点儿疯。喜欢他们的人喜欢得不得了,恨他们的人恨得牙痒痒。通常他们在内部的树敌比在外部多,想保住他们是件并不容易的事儿。但是个稍微公道点的人就能看得出来他们对自己一手打造出来的产品的爱。无招把一切的时间都给了钉钉,俊旸也差不多,直到忽然宣布离职的前一天还在推广 Qwen 3.5 小尺寸模型。无招和俊旸,都是各自产品独一无二的人格化代言人,他们的气质和他们所做的产品融合在了一起,而且能被轻易地感知到。

29. 当然最像的,是无招曾经的处境和俊旸今天面临的状况:靠自己的打法做起来,曾经连内部都不爱用的钉钉,成了阿里云企业级客户的核心抓手。阿里要的是 " 云钉一体 ",把钉钉并入阿里云做企业客户获客工具,而无招坚持钉钉应该服务中小企业、独立发展甚至上市。在 Qwen 和俊旸这儿,面对的是阿里要 Qwen 的模型底座能力全面服务千问 APP 和阿里生态的商业化,但他们本身更在意基座模型的持续演进和 Qwen 的全球影响力,这是南辕北辙的两条路。所以,无招和俊旸都没办法体面退场,他们都不得不带着非常复杂的情绪,离开他们自己参与和付出了颇多的产品和业务。

30. 钉钉和 Qwen 其实共享了一个很有意思的叙事结构:都是在阿里体系的边缘地带,靠创始人 / 负责人的个人驱动力,面向阿里并不擅长的用户群体,用阿里不熟悉的方式把产品做起来的。然后一旦做大了,公司就想把它收编进自己熟悉的商业逻辑里——大企业客户或是 C 端商业化。

31. 但这又是很矛盾和令人纠结的地方:我不像很多为俊旸离开而惋惜的人那样,将一切归咎于阿里巴巴的文化。阿里的文化有它非常迷人的一面:看上去有点吝啬的容忍和保护,让边缘业务在无法 " 大力出奇迹 " 的情况下自行野蛮生长,前期的试错空间巨大,留白足够多。Qwen 是如此,钉钉是如此,甚至连阿里云本身都如此,你会发现阿里如此庞大的组织在一些角落里是如此有弹性。但另一面是:边缘业务一旦做大做强,它便成了桃子,便要无条件融入跟它的初始设定并不一致甚至完全相反的业务,就要变成商业化的子弹,它们的灵魂人物就得被迫离开,甚至跟组织决裂。Qwen 是这样,钉钉是这样,阿里云当初又何尝不是如此呢?

32. 无招离开后四年又被请了回来——因为阿里发现没有他的钉钉确实缺了灵魂,生意是做得不错了,但 AI 时代又需要产品型创始人。但回来的无招学乖了,他明白了钉钉其实不是他的。阿里会不会在未来某个节点意识到:开源社区的影响力其实很重要,千问的商业化离不开全球开源模型领导者的口碑,而这不是靠组织架构调整能补回来的,到时候再请人回来?还是说已经意识到了?

33. 我相信,钉钉和 Qwen 但的上半场脚本如此一致,但下半场的脚本应该彻底不同。因为时代不同了,环境更不同,当然,人也不同。

34. 比起俊旸,无招在阿里的羁绊太多了。其中最大的羁绊就是马老师,即便可能负气出走,但藕断丝连,离不开也不想离开。相比之下,靖人都不算是俊旸的羁绊,如果走了,那可就是真的走了。

35. 无招出走创业,对阿里内部那些看不惯无招的人来说,无外乎就是少了一个眼前的麻烦,离开了没准还能做朋友,回来了就再当敌人。" 云钉一体 " 的竞争对手是华为、腾讯和国有云,再加个飞书,是中国自己一亩三分地的事儿。可是俊旸出走,那就真的只能在战场上见了。是字节的战场、腾讯的战场,还是 Meta 的战场、Google 的战场、Grok 的战场 ....... 一切皆有可能。AI 时代的头部人才的稀缺程度,远远高于移动互联网时代的产品大拿。

36. 过去的三年,全球的 AI 界经历了太多的内部倾轧、斗争、厮杀、背叛、分裂和媾和,放大了碳基生物的人性脆弱和不堪。一切无他,因为人聪明且自负,利益诱惑又如此巨大,未来看似一切都有可能,又一切都是未知。每个人在认为自己将得到什么的时候,也会盘算自己失去的会不会更多。

37. 阿里肯定会努力证明没有林俊旸的千问还是那个千问,甚至是更好的千问。但事实上,它已经失去了很多东西。

38. 与无招不同,很多失去的人、口碑和影响力,可能是回不来的。

相关标签
硅星人

硅星人

硅是创造未来的基础,欢迎登陆硅星球。

订阅

觉得文章不错,微信扫描分享好友

扫码分享