AI 教父杰弗里 · 辛顿可能是这个时代对 AI 最悲观的人。
2024 年的诺贝尔物理学奖颁给了他,以表彰他在神经网络领域的开创性成就。但 "AI 威胁人类 " 一直都是辛顿的主要论调。除此之外,他对当前主流大模型的经典评价是," 一辆锈迹斑斑到处都是问题的车,只是进行了一次喷漆。"
众所周知,目前主流大模型都采用了基于人类反馈的强化学习(RLHF)来进行预训练微调,而辛顿的评价原话是 "ChatGPT 的 RLHF 就是垃圾。"
王欣是杰弗里 · 辛顿的硕士研究生。在辛顿执教多伦多大学期间,他见证了辛顿在整个学术圈最边缘的时光。
作为辛顿的关门弟子,在王欣想要继续跟随辛顿读博士的时候,辛顿劝他辍学,不要再读了。原因是,这个专业根本找不到工作。他的师兄师姐们的求职之路都不顺利。
在很长一段时间里,辛顿选择的神经网络研究方向就一直不被学术界看好,认为是没有未来、注定失败的一条路。
在硅谷,这个专业在 2000 年前后基本没有任何应用场景——没有人认为神经网络的方向是对的。彼时,人工智能研究最流行的,还是穷举法。
很长一段时间里,多伦多大学计算机科学系官网上辛顿的个人页面都极为简陋。只有黄褐色背景上的一行行文字与超链接。其中还有他的声明:
不再招收学生、博士后或访问学者。
于是,王欣成为了他第一批华人弟子,也是最后一批关门弟子。
因为辛顿的不断苦口婆心的劝说,他没有再继续攻读辛顿的博士,而是选择回到国内大厂阿里巴巴,后来还参与了滴滴出行的创业,是滴滴出行的创始团队成员。
在中国的互联网大厂担任高管多年,王欣看起来比辛顿还是要乐观一些,在他看来,这一轮 AI 的商业化应用还是有巨大的机会。
今天,生成式人工智能验证了杰弗里 · 辛顿多年的技术路线。但辛顿依然被认为是 AI 的 " 末日先知 ",对 AI 与人类未来持怀疑态度,和他的另一位学生、OpenAI 的前首席科学家 Ilya Sutskever 一样,辛顿一直主张 AI 应当要对齐人类。
和他的导师类似,王欣对于当前的人工智能浪潮,也持有保留看法,但他更关注应用侧的变化," 大模型目前看依然只是工具,工具和基础设施,是完全不同的估值逻辑。"
Meta 的 CTO 安德鲁 · 博思沃兹的想法和王欣类似。对于 AI 最被看好的应用场景机器人,他的说法是," 千亿数据都无法堆出‘抓杯直觉’。"
现有的人工智能路线,真的是错的吗?
大模型只有智能,没有智慧
DeepResearch:你怎么看待这一轮 AI 革命?
王欣:我对于当前的技术本身依然持悲观态度。因为当前的所有大模型,本质上还是统计模型,无法产生真正的智慧或新知识。
统计模型的本质是通过数据归纳规律,但这种归纳只是对已有信息的总结,而非创造新知识。人类历史上所有推动社会进步的新知识,都是突发性的、非量变积累的结果。比如禅宗所说的 " 顿悟 ",是一种超越线性逻辑的创造性突破。
而大模型的训练过程是纯粹的量变,通过穷举数据寻找规律,这种模式无法引发质变,也无法突破现有知识的边界。
DeepResearch:杨立昆最近批评了辛顿的悲观。你怎么看?
王欣:辛顿早期研究神经网络时,正是试图模仿生物大脑的归纳能力。他提出,人类大脑并非通过穷举法处理信息,而是通过神经网络的层级结构实现知识的抽象与归纳。
这种路线在 2000 年前后并不被主流认可,甚至被视为 " 不切实际的梦想 "。
但后来 AlphaGo 的突破证明了这一点——传统穷举法在复杂问题(如围棋)面前完全失效,而神经网络的归纳能力成为关键。
然而,即便如此,大模型的能力依然局限于 " 归纳 " 而非 " 创造 ",它无法像人类一样产生真正意义上的智慧。
从技术路线来看,神经网络的突破依赖于生物学启发,而非纯粹的数学优化。辛顿的研究证明,人类大脑的神经网络并非简单的 " 输入 - 输出 " 模型,而是通过层级化的特征提取和抽象能力实现认知。
比如视觉感知需要从像素到边缘、形状、物体的逐级抽象,这一过程与当前的卷积神经网络相似。但是人类的抽象能力远超机器,我们不仅能识别物体,还能赋予其意义。
所以我说,大模型的 " 智能 " 是统计学意义上的归纳,而非人类智慧的创造。它的价值在于提升效率和辅助决策,但无法替代人类在复杂领域的核心作用。
所以未来的技术发展,还需要突破 " 统计归纳 " 的框架,探索更接近生物大脑的 " 智慧生成 " 机制,而这可能需要跨学科的协同创新。
从现阶段来看,我们对人脑的理解都太少太少了,而 AI 要复制人脑,还有更远的距离。这一点我是支持杨立昆的看法的。
AI Agent 很关键,但现有 AI 公司估值存在泡沫
DeepResearch:2023 年底时我采访凯文 · 凯利,他说当时 AI 还处于 blackberry moment,你如何看?
王欣:确实。别说 2023 年了,现在 AI 的商业化应用也还没有找到 " 杀手级 " 场景,许多公司的高估值缺乏支撑。
我们以上一轮的人脸识别为例就会发现,尽管技术已经成熟,但其商业需求过于狭窄,主要集中在政府或特定行业,难以形成规模化市场。16-17 年曾有一波 AI 泡沫,商汤、旷视等公司因过度依赖政府订单而迅速降温。
相比之下我们再看看互联网时代,淘宝的成功在于解决了交易效率的核心问题,而 AI 目前的工具属性尚未达到基础设施的层级。如今的 AI 公司如果无法找到可持续的商业需求,可能重蹈覆辙。
基础设施的价值在于长期沉淀和规模化应用,而大模型目前只是工具,无法支撑 " 基础设施 " 的估值逻辑。以当年的英特尔为例,其价值在于为整个计算生态提供底层支持,而当前 AI 公司尚未具备类似的影响力。
DeepResearch:最近芝加哥大学有一位教授发了一份报告,结果是 AI 大热两年半,完全没颠覆我们的工作,对于收入的影响也微乎其微。
王欣:所以我说,还没有到真正改变世界的时刻。
我说的估值泡沫,核心在于技术乐观主义与商业现实的脱节。当前 AI 公司的高估值,往往基于对未来技术的想象,而不是说当前可验证的商业价值。
比如许多 AI 初创企业宣称 " 颠覆传统行业 ",但实际落地时却发现,大家更关注成本效益而非技术先进性。
历史经验已经反复过很多次了,技术泡沫的破裂是产业发展的必经阶段。20 世纪 90 年代的互联网泡沫(如 Dot-com Bubble)催生了亚马逊、Google 等巨头,但也淘汰了大量缺乏商业模式的公司。
当前 AI 行业的估值逻辑类似:资本追逐短期概念,而市场最终会筛选出真正具备商业价值的企业。比如英伟达的成功在于其 GPU 芯片成为 AI 计算的基础设施,而非依赖某个具体应用场景。
相比之下,专注于垂直领域的 AI 公司(如人脸识别)如果无法拓展至其他市场,可能面临生存危机。
DeepSeek 是微软 PC 时刻
DeepResearch:如何看 Manus 为代表的 AI Agent 爆火?
王欣:我对于 AI Agent 的长期未来还是非常乐观,因为其潜力在于人机交互的革命。比如语音助手或智能客服的普及,标志着人机交互从键盘、触屏向自然语言的转变。
这一趋势有点类似于 PC 从专业设备到大众工具的演变,不过当前的 AI Agent 仍处于 " 工具 " 阶段,缺乏真正的自主决策能力。
可技术的 " 基础设施化 " 需要长期积累。以微信为例,其成功并不是说源于技术突破,而是通过解决社交需求的痛点,最终成为用户生活的 " 基础设施 "。
这一轮如果某一款 AI 应用想达到类似地位,需经历的是从工具到平台再到生态的演进。比如 OpenAI 的 GPT 模型通过 API 开放,为开发者提供了通用的语言处理能力,但其商业价值仍需依赖第三方应用的创新。
这种 " 平台化 " 路径与微软的 Windows 系统类似,但当前 AI 的生态尚未成熟,许多企业仍停留在 " 技术展示 " 阶段。
所以尽管我比较乐观,但 AI Agent 的未来取决于商业化能力的提升,而非单纯的技术突破。当前的高估值反映了市场的乐观预期,但也暗含泡沫风险。企业需回归商业本质,聚焦真实需求,而不是追逐虚幻的 " 颠覆 " 叙事。
只有当 AI 真正成为基础设施,其估值逻辑才能与商业价值匹配。
DeepResearch:你怎么看待 DeepSeek 的出现?
王欣:就像我们刚刚说的,DeepSeek 的出现让我联想到比尔 · 盖茨降低 PC 成本的历史。技术的普及需要门槛的降低,而 DeepSeek 最大的成就是降低了 AI 的使用门槛,类似 PC 从专业设备到大众工具的转变。
所以未来 AI 的最大爆发点是让普通人无需学习复杂操作即可使用 AI。这种平权化的技术扩散,将带来比互联网更大的变革。
技术的普及往往需要 " 平民化替代 "。回到我们刚刚说的科技商业史,PC 的普及得益于 Windows 系统的易用性,而智能手机的普及则依赖于安卓的开源生态。
DeepSeek 的意义在于,它可能成为 AI 领域的 "Windows" 或 " 安卓 ",通过降低技术门槛,让更多人无需编程即可使用 AI。
从商业角度看,我把 DeepSeek 视为 "PC 时刻 " 的开始,是因为其重新定义 AI 的应用场景。比如说一个农民通过语音指令让 AI 规划农田灌溉,或一个学生通过自然语言查询学术资料,这些场景在传统 AI 公司看来可能是 " 低端需求 ",但正是这些 " 边缘场景 " 构成了技术普及的基石。
DeepSeek 的出现标志着 AI 从 " 精英工具 " 向 " 大众工具 " 的转变。这一轮技术平权可能带来比互联网更大的变革,但其成功与否取决于能否解决商业落地、伦理风险和社会公平等问题。
硅谷太傲慢了,中国的机会在平替和平权
DeepResearch:硅谷目前是如何看待中国的 AI 产业的?之前的国会山听证会能够看出来,美国事实上存在对于中国技术进展的不确定性。
王欣:在美国这几年,我最大的感受是,硅谷正在变成 " 老钱 ",而且变得越来越傲慢,越来越有门槛了。甚至我们可以说,硅谷的保守与资源垄断正在限制创新。
所以从这一点来看,我非常看好中国市场在这一轮 AI 革命中的可能性。
还是回到历史,如果没有华强北的低成本设备,你觉得中国的移动互联网能够普及得这么快吗?而滴滴的崛起离不开安卓手机的普及,而非高端设备。
边缘场景往往能突破主流思维,而硅谷的精英化路线反而可能成为桎梏。加上这一轮打压和限制,我的预测是,中国在资源匮乏的背景下,反而可能激发更强的创新力。未来,中国的平替路线和技术平权可能成为 AI 竞争的关键。
硅谷的成功依赖于 " 精英主义 " 和 " 资本驱动 ",但这种模式正在遭遇瓶颈。比如斯坦福大学,因为它离硅谷实在是太近了,它并不缺乏资源,但丰富的资源,真的能带来创新吗?我是持保留态度的。
事实上大家也发现了这一点,因为后来越来越多的创新都诞生在更远的伯克利。于是硅谷的钱又都跑到伯克利去了。
相比之下,中国的创业环境更注重 " 草根创新 " ——目前互联网大厂的创始人很多都不是名校毕业,而是凭借对市场需求的敏锐洞察抓住机会。
所以这也是未来值得乐观的地方,这种 " 边缘创新 " 模式在 AI 时代同样适用。
这就是我说的,资源匮乏反而可能成为创新的催化剂。硅谷的 " 老钱 " 模式正在削弱初创企业的活力。相比之下,中国的创业者更愿意尝试 " 蓝海市场 "。例如,DeepSeek 的低成本 API 模式,正是针对中小企业和个人开发者的需求设计的,而这类市场在硅谷的估值体系中被视为 " 非主流 "。
DeepResearch:国内互联网大厂未来机会在哪里?
王欣:科技公司谈基业长青,是一个非常奢侈的话题。生生死死才是科技行业的常态。这可能和麦当劳、肯德基、沃尔玛是完全不同的商业逻辑。所以关键是我们如何看待它。
历史上的颠覆性创新,比如我曾经工作过的滴滴和阿里巴巴,其实都是源于被主流忽视的 " 边缘场景 "。
滴滴不是简单地对 Uber 的模仿,淘宝的崛起则源于对 C2C 交易效率的重新定义,而绝不是简单模仿亚马逊的 B2C 模式。
这种 " 边缘创新 " 的逻辑在 AI 领域同样适用:当前大厂的资源集中于大模型研发,而真正的突破可能来自中小企业或初创公司在垂直领域的应用探索。
我觉得创始人们可能需要做好这样的心理准备,技术迭代和商业需求的不确定性远超传统行业。比如 IBM 曾是计算机行业的霸主,但其核心业务(大型机)被 PC 和互联网取代;英特尔的 CPU 虽成为基础设施,但面对 AI 芯片和量子计算的挑战,其地位同样面临动摇。
这种 " 死亡 " 并非失败,而是行业演化的必然结果。
但我们可能要跳出公司的视角来看,这是我开始对制度经济学感兴趣的原因。科技行业的核心是推动社会交易效率的提升,而不是说去追求永恒的生命力。
你看,从 PC 到移动互联网,再到 AI,每一次技术浪潮都会淘汰旧有格局,但也会催生新的基础设施。对于中国互联网大厂而言,关键在于在动荡中找到 " 基础设施化 " 的路径:通过解决真实需求、降低技术门槛、拥抱边缘创新。
本文来自微信公众号:深水研究,作者:陈白