" 闭源人工智能在阻碍我们探索真正的科学。"
说这句话的不是别人,是大名鼎鼎的 Transformer 发明者——Ashish Vaswani。
在 Scaling Law 碰壁后,独角兽们越来越搞不清技术方向。
迫于投资者压力,不得不亲自下场探索落地场景,更没精力去搞科研了。
为了填补这块空白,一路从 Google 到 Adept 再到 Essential AI 三次搬家的 Vaswani,今年再度迎来巨大转折点——
All in 基础研究,并且坚持要走开源路线。
" 我们很乐意成为西方世界的 DeepSeek"
2017 年,还在 Google Brain 工作的 Vaswani 与团队共同写出了《Attention Is All You Need》,这篇论文在 5 年后开启了如今的 GenAI 大航海时代。
2022 年,他离家出走,与 Niki Parmar(Transformer 八子之一)和 David Luan(当时的 Adept CEO)创办了Adept AI。
可惜好景不长,据 BloomBerg 报道,Vaswani 在 Adept 与某位联合创始人爆发了一次严重冲突。
这次争执让他意识到:
只有创立一个完全属于自己的公司,才能有绝对的自由。
于是 2022 年底,他再次挥手告别,拉起新团队创立了Essential AI。
结果,就在今年年初,Vaswani 突然对董事会宣布:
放弃公司现有业务,并将精力全部投入基础研究。
What!?
这不是把商业模式直接推翻重来吗?
出乎意料的是,董事会和资方居然都在一定程度上对 Vaswani 表示了支持。
参与 Essential AI 上一轮融资的 AMD 在采访中表示:
这个路线确实有点不太寻常,但人工智能领域需要更开放的替代方案。
看来,三次迁居的努力没有白费,Vaswani 终于如愿以偿,集结了一帮理念同频的大佬。
为商业化四处奔波的这么多年,与资本和客户打了无数次交道,Vaswani 真的累了。
蓦然回首,在他的精神世界中,其实一直有一块能承载他一切美好期许的土地,这片伊甸园的名字叫做——开源。
他在 Essential 官网上写道:
在教育和医疗等领域,有真正的科学需要追求,我们不能让封闭的人工智能阻碍人类探索这些新方向。
是不是听着很耳熟,没错,Vaswani 在与 Economics Time 的采访中直接承认了:
" 短期内,我们想要成为西方世界的 DeepSeek。"
在他的设想里,AI 不该只服务于商业,而是要真正进入教育、医疗等关乎大众的场景,让普通人也能享受到技术红利。
比如,一个偏远地区的孩子也能用开源 AI 上到最好的课;一个小诊所也能借助开源工具做出最准确的诊断。
更重要的是,Vaswani 可不光是喊口号,Essential 在转型后的确下了不少真功夫。
提出转型后的不久,2025 年 4 月,Essential AI 团队发表了一篇题为《Rethinking Reflection in Pre-Training》的论文。
这篇论文提出了一个颠覆性观点:
大型语言模型的反思能力其实在预训练阶段就开始萌芽。
简单来说,相较于用 RL 在后训练打补丁,他们在预训练中取得了突破,并且这个技术可能大幅降低训练成本。
要真能成,那对整个开源社区绝对是大利好。
Vaswani 看到了什么?
为什么 Vaswani 说不能把希望寄托在独角兽公司身上?
Vaswani 担心,这些模型性能最优异的独角兽正在阻碍人工智能进步。
有几家公司关闭了长期的研发工作,以便将所有资源用于商业化,这种现象在市场环境恶化时更加明显。
自 Scaling Law 迎来边际收益递减的拐点后,AI 独角兽的产品化倾向已是众人皆知。
Anthropic 做浏览器,OpenAI 派出著名产品经理 Kevin Weil …… . 各大模型厂商纷纷下场,亲自探索商业模式。
这折射出来的一个问题是创新者窘境。
Scaling Law 兴起后,暴力美学的砝码使得 AI 研究的天平从学术机构几乎完全向企业实验室倾斜。
不过,产业界虽垄断了最稀缺的生产要素,他们真的可以 All in 创新吗?
绝大多数时候不能。因为那可能烧掉几个亿,而且不一定能看到回报。
关键在于,无论公司成立的初衷是什么,创始人最终都得优先对投资人负责。
因此,探索商业模式和利益最大化是闭源模型的最终归宿,这从一开始就注定了。
如今,这把热烈的商业化之火同样烧到了硅谷这批天之骄子身上。
今天等着小扎买买买,明天听说 OpenAI 搞收购,下个月又去创业。
这种节奏很适合追热点,但科研不一样——要搞出突破性的成果,你得花几年甚至十几年死磕一个方向。
而频繁的流动,让团队很难静下心来。
Vaswani 叹息道,这不是科学应有的进步方式。
那 Vaswani 想要怎么做?开源阵营能够拯救 AI 吗?
老生常谈的话题——人多力量大,知识共享才是推动 AI 技术发展的关键动力。
闭源公司虽手握顶级资源和技术成果,但为了维护投资人的利益,不得不把这些秘密藏起来,以阻碍竞争对手。
但如果有成千上万的研究者和开发者一起贡献代码,整个生态齐心协力,并行推进,也许能克服开源阵营资源匮乏的问题。
当然,开源最重要的问题在于资金来源,毕竟咱不能总靠 " 用爱发电 "。
对此,Vaswani 参考了互联网产品的解法:
交叉补贴大法好
什么是交叉补贴呢?
这是互联网时代很常见的一种商业模式,典型案例就是浏览器:Google 搜索对用户完全免费,取得市场份额后依靠广告回血。
简单来说,就是一部分业务赚钱,用来补贴另一部分业务。
先构建一个开源的垂直领域模型,这个基座本身不收钱。
但如果有客户想用这个基座搭建自己的 AI,可以向 Essential AI 购买训练数据和相关产品。
通过这个途径赚来的钱,正好能用来反哺开源社区。
这样,既能保证技术开放,又能让公司活下去。
虽然闭源模型看起来更容易变现,但实际上也面临巨大的成本压力。
实际上,如果按照之前科技互联网的发展来看,开源通常是更赚钱的一方,毕竟构建起了一整个生态。
One More Thing
最后,关于 Ashish Vaswani,或许还有一点点可以多说的。
在 2011 年的南加州大学,有两名活跃在自然语言处理(NLP)前沿的教授——蒋伟(David Chiang)与黄亮(Liang Huang)。
他俩都是 Ashish Vaswani 的导师。
蒋伟教授的学士和硕士均就读于哈佛大学,后到宾夕法尼亚大学攻读博士,他提出的分层短语翻译模型曾被 Google Translate 采用。
黄亮教授本科毕业于上海交通大学计算机系,同样是在宾夕法尼亚大学进修的 PhD,主要研究方向是开发高效算法来加速 NLP 任务,Vaswani 是他指导的第一名博士生。
怎么说呢,虽然 Transformer 八子里没有华人作者,但 " 功劳簿 " 里,也并非全然没有华人贡献。
这实际也是另一个维度的开源之力。AI 也好、深度学习也好,之所以可以站上浪潮之巅,根本上就在于始终有一个持续交流、开放互助的生态环境。
开源是一种选择,更是一种精神和信仰。
参考链接
[ 1 ] https://www.bloomberg.com/news/features/2025-09-03/the-ai-pioneer-trying-to-save-artificial-intelligence-from-big-tech
[ 2 ] https://www.communicationstoday.co.in/ashish-vaswani-the-mind-behind-the-transformer-that-powers-genai
[ 3 ] https://economictimes.indiatimes.com/tech/artificial-intelligence/we-would-like-to-be-deepseek-in-the-west-says-essential-ai-cofounder/articleshow/121891250.cms
[ 4 ] https://www.forbesindia.com/article/ai-special-2025/ashish-vaswanis-essential-ai-wants-to-use-powerful-ai-to-solve-humanitys-biggest-challenges/96148/1
[ 5 ] https://www.wired.com/story/eight-google-employees-invented-modern-ai-transformers-paper/
[ 6 ] https://www.essential.ai/
[ 7 ] https://viterbischool.usc.edu/news/2023/03/attention-is-all-you-need-usc-alumni-paved-path-for-chatgpt/
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
专属 AI 产品从业者的实名社群,只聊 AI 产品最落地的真问题 扫码添加小助手,发送「姓名 + 公司 + 职位」申请入群~
进群后,你将直接获得:
最新最专业的 AI 产品信息及分析
不定期发放的热门产品内测码
内部专属内容与专业讨论
点亮星标
科技前沿进展每日见