雷科技 AI 组 | 编辑:Auff | 监制:罗超
科技圈又爆出重磅炸弹!就在今天,大模型领域的绝对巨佬、Transformer 论文的核心作者 Noam Shazeer 在社交平台上正式宣布:离开谷歌,加入 OpenAI。

很多人可能对这个名字有些陌生,但他不仅是大牛,更是如今整个生成式 AI 时代的奠基人之一。他是 2017 年那篇改变世界的封神论文《Attention Is All You Need》的共同一作。

为了让大家直观感受他在学术界和工业界的统治力,可以看看他的 Google Scholar 主页数据,总引用量高达惊人的 357394 次!
Noam Shazeer 和老东家谷歌的关系,也是一绝。
他曾是谷歌的元老级猛将,一手打造了早期的大模型 Meena,但受限于当时的大厂包袱,一气之下于 2021 年离职创办了 Character.AI。
到了 2024 年,后知后觉的谷歌砸下近 27 亿美元把他连人带团队请了回去。

其实这两年谷歌在 Gemini 家族的迭代上也算是火力全开,从底层多模态到超长上下文表现都可圈可点,这里面肯定有 Noam 的功劳在。
结果如今才不到两年, Noam 转头就跳槽去了 OpenAI,果然,要走的终究是留不住啊。对谷歌来说,这波简直是赔了夫人又折兵,一口老血喷出来。
现阶段的大模型,在核心能力上已经很难拉开巨大的差异,反而是在应用端、算力端需要快速提升,因为烧 tokens 的路线在经济帐上明显算不过来。
仔细看看 Noam 今年的最新专利,这里面藏的全是大模型下一阶段演进的最核心命题:
Agent 的终极拼图:专利 US20260037744A1 明确提到了使用结构化工具(如 API)。这意味着它的核心不仅是内部推理,更是让大模型具备自主调用外部工具、API 的 Agent 能力。OpenAI 显然需要他来补齐打造 " 超级智能体 " 最关键的一环。
用 AI 设计 AI: 专利 US20260105300A1 揭示的是神经架构搜索(NAS)。这说明他不仅懂宏观设计,更在研发用算法去自动搜索和拼装比现有 Transformer 更高效的底层网络组件。
榨干算力与硬件性能:专利 US20260044710A1 正是大名鼎鼎的混合专家模型(MoE)核心逻辑;而另一项带有 linear units 的专利,则是通过引入元素级乘法来优化底层前馈网络(如业界大火的 GLU 变体)。
总结来说,OpenAI 拿下 Noam,看中的是他底层构建的能力。
大家觉得 Noam 的加入,能帮 OpenAI 继续稳坐铁王座吗?欢迎在评论区聊聊你的看法!

扫码免费加入
「一起 AI」社群,一起拥抱 AI 大时代。