
访 谈:孙允广 正和岛内容总监
编 辑:豆汁儿
来 源:正和岛(ID:zhengehdao)
正和岛【新质企业家】访谈唐文斌完整视频
新质说
● 技术信仰:从人脸识别到具身智能,跨越 AI 两个时代,始终相信技术可以改变物理世界。因为相信,所以看见,也因为信仰,所以能够抵达。
● 价值务实:不满足于让机器人跳舞,而是赋予它在真实世界里解决问题的能力。让机器人拥有 " 大脑 ",从替代人类 " 不想干的活 " 开始。
● 斜率思维:当前模型第一不重要,重要的是那一阶导。保持极高的迭代效率,让技术飞轮快速旋转,比任何一个静态节点的排名都更具意义。
在王者荣耀里,虞姬是个后期英雄,没有太多复杂和花哨的操作,前期坚定发育,到了后期爆发力极强。
唐文斌很喜欢这个角色。
而现实中,唐文斌的工位和普通员工在同一个大开间,没有独立办公室——很像他玩虞姬时 " 去繁就简、直奔本质 " 的作风。

他坐在会议室里,面前放着一个印有 "Dexmal X" Logo 的杯子,这的确容易让人产生联想——马斯克对 X 的迷恋,SpaceX、xAI、X 平台。
但他说这不是刻意模仿,"X 代表更科技、更多可能性的东西。"
这是 2026 年 4 月的一个下午,正和岛 " 新质企业家 " 栏目走进了原力灵机。
从旷视科技到原力灵机,唐文斌的创业轨迹,横跨了中国 AI 产业的两个时代。
14 年前,他和印奇、杨沐创办旷视,成为 AI 1.0 时代的标志性人物;14 年后,他带着一群 " 旷视老将 " 重新出发,闯入具身智能这片更复杂的战场。
这家成立仅一年多的机器人公司,正在试图回答一个所有人都想知道的问题:
当大模型撞上物理世界,具身智能的 "ChatGPT 时刻 ",还有多远?

用眼睛看世界
2026 年的中国机器人赛道,热浪翻涌,群雄扎堆。
" 仿生蔡明 " 在春晚舞台上演小品,特斯拉的 Optimus 隔段时间就释放一次新进展,马斯克说未来人形机器人的数量会超过人类。
各大车企、互联网巨头、创业公司纷纷入局,投资人拿着钱找项目,猎头疯狂挖人。
而在前几天举办的 2026 北京亦庄半程马拉松上,人形机器人与人类跑者同场竞技,再次将 " 机器人何时真正融入现实世界 " 的讨论推向高潮。
据不完全统计,2025 年中国机器人领域融资事件超过 600 起,总金额超过 500 亿元。
在这波热浪中,原力灵机无疑是资本最追逐的标的之一。
成立不到一年,三轮融资累计近 12 亿元—— 2025 年 3 月天使轮 2 亿元,A 轮蔚来资本领投,A+ 轮阿里巴巴独家注资数亿元。
但唐文斌对这股热潮出奇冷静:" 今天大家的水平其实都挺差的。"
时间倒回 2011 年,唐文斌和清华同学印奇、杨沐一起创办旷视科技。那时深度学习还是个学术圈的小众话题,人脸识别的准确率惨不忍睹。
他们从一款手机体感游戏起步,误打误撞杀进了金融级身份认证领域,成了支付宝刷脸支付背后的技术供应商。
" 我们其实先做的是偏技术的东西,然后想这个技术哪里用。" 唐文斌回忆,当时 iPhone 4 刚出前置摄像头,他们觉得可以把 Kinect 那种体感交互搬到手机上,于是做了一款人脸追踪小游戏。
游戏火了,创业的念头也从此落地。
公司取名 " 旷视 " ——旷,就是大的视觉。
" 我们认为未来一定会有很多机器人,机器人就像人一样需要眼睛。人的信息输入百分之九十几都靠眼睛,所以我们觉得眼睛是走向机器人的第一步。"
从人脸识别到物流机器人,旷视的机器人梦一直在水面下流淌。
2018 年,他们正式切入物流场景,给仓库做自动化方案。
最出名的一仗是优衣库上海仓库——超过 1000 台不同类型机器人协同作业,单体项目接近 3 亿元,是当年国内物流自动化领域最大的一单。
但也是一场 " 噩梦 "。
唐文斌回忆,投标过程像 " 超女选秀 ",所有供应商被一轮轮筛选,大家互相 " 左脚踩右脚上天 ",不断 over promise。
拿下来之后才发现,实际能力只达到目标的百分之三四十,项目濒临失败。
于是他带着团队在仓库里蹲了三个月。推倒代码重来,主动承担赔偿,向客户要了半年时间。
项目最后跑通了,效率远超优衣库其他自动化仓库。因为这个项目,他被邀请去日本见了迅销集团社长柳井正。
在仓库里与物理世界贴身肉搏的经历,让他比很多人都更早地看清,软件算法与硬件落地之间,存在着巨大鸿沟。
从 " 看懂世界 " 到 " 改变世界 "
2025 年,唐文斌拉上旷视时期的核心团队成员,创办了原力灵机(Dexmal)。
方向很明确:做机器人的 " 大脑 "。

而这个改变的前提,是为机器造一个真正能思考、会判断的 " 大脑 "。
为什么大脑如此重要?
" 你看今天的机器人,运动控制已经做得很好了,跳舞跳得比人都帅。但它没有在操作这个世界,没有在改变这个世界。" 唐文斌一语道破。
机器人行业内一个心照不宣的共识是,硬件本体的进化速度远快于智能水平的进化。
即便是以运动控制闻名的宇树科技,也在 IPO 时明确表示,募资的近一半的资金——约 20.22 亿元,就是要用来攻克机器人的 " 大脑 " 问题。
" 你让它去炒个菜,成功率能有多少?切个水果呢?" 在唐文斌看来,现在机器人 " 智商的缺失 ",使得它面对真实世界的复杂任务时,几乎寸步难行。
硬件已经备好,但缺少一个能指挥它的 " 司令部 "。
这个 " 大脑 " 到底难在哪儿?他一一列出。
首先,模型本身该长什么样,架构怎么设计,业界还没形成共识。
其次,给机器人 " 喂 " 什么数据去学习,是纯机器人数据还是加上人类数据,也没定论。
再者,训练方法是什么,流程怎么搭,没人清楚。
并且,即使有了一个六七十分的模型,怎么让它在干活儿的过程中自己发现错误、收集数据,再通过一个 " 数据飞轮 " 越转越快,变成八九十分?
这条链条上的每一环,现在都是问题。
此前在旷视做计算机视觉(CV),面对的是一个相对确定的数字游戏,评测指标清晰,数据集固定。
但机器人是一个与物理世界充分交互的闭环系统。" 任务没成功,天知道中间发生了什么。" 原力灵机联合创始人范浩强感慨。
所以唐文斌的思考并没有停留在做模型这一层,他有很务实的商业推演逻辑,然后给团队定了一个选择应用场景的标准:
第一,错误容忍度高的场景。现在做不到百分百成功,场景本身要有兜底机制;
第二,节拍容忍度高。不能要求机器人像自动化设备一样精准卡点,要允许它节奏有快慢;
第三,泛化性的作业需求。任务不能太单一,否则非标自动化就能解决,用不上通用机器人;
第四,长时间作业。让机器人持续工作,才能把价值卷出来,覆盖掉成本。
按照这个标准反推,他认为家庭场景现在还不成熟。
" 你买个人形机器人回家,挺贵的,能干的活还很少。而且用户的容忍度极低,1% 的概率把碗摔了,你收拾都不知道谁去收拾。"
相比之下,仓储物流、工业制造等 B 端场景,才是现阶段验证技术、积累数据、打磨迭代能力的真实场景。
" 需求就在那里 " 他说," 阿姨干的活能不能让机器人干,大街上扫地能不能让机器人好好扫,我们不是在创造需求,我们是在创造解决方案。"
而创造解决方案的第一步,是先回答一个更底层的问题:这个 " 大脑 ",到底该怎么造?
第一不重要,重要的是 " 迭代的斜率 "
2026 年 2 月,原力灵机发布了第一个具身原生大模型 DM0(DexModel 0)。
在真实机器人操作的开源评测平台 RoboChallenge 上,DM0 的成绩拿下双项世界第一。
但唐文斌认为 " 这个第一也没那么重要 "。
他关心的不是当前这个点的数值 f ( x ) ,而是曲线的导数。
他把公司内部的文化总结为两个词:技术信仰,价值务实。
而支撑这两个词落地的,是他笃信的一个更本质的竞争力——迭代的效率。
" 我们要的不是今天 f ( x ) 的值,我们要的是那个一阶导。" 唐文斌说,创业公司和大厂竞争,拼的不是存量,是谁迭代得更快。
"idea 是廉价的。大家都很聪明,你知道的东西,三个月后别人也知道了。别人知道的东西,我们大概三个月后也知道了。所以真正重要的是迭代的斜率。"
为了保持这个高斜率,技术路线的选择就变得至关重要。
现在业内做 VLA(视觉 - 语言 - 动作)模型的主流做法,是在一个现成的多模态大模型(VLM)上 " 嫁接 " 一个动作模块。
这个 VLM,通常是用海量互联网图文视频数据训练出来的开源模型。
唐文斌打了个比方:这就像一个九年制义务教育的初中生,刚上完初中就被拉去体校狂练体育。
后果有两个:一是 " 根骨不扎实 ",因为它从没见过物理世界的数据,相当于 " 没有从小练体育 ",体能上限不高。
二是 " 光练体育不练文化课 ",原来在互联网数据上积累的理解能力,在专攻体育三年后,也退化得差不多了。
原力灵机的思路截然不同。
他们要搞 " 原生 " 训练:从模型训练的第一天起,就让它同时接触互联网多模态数据和物理世界数据——视频、机器人操作数据、导航数据、力触觉数据——并且把 " 理解世界、操作世界、预测世界 " 三个目标联合训练。
" 我们希望打造一个德智体美劳更全面发展的模型。"
这其中有一个更深层的技术分野:为什么不直接买一个现成的 " 世界模型 ",然后在上面训练机器人?这听起来更直接。
唐文斌的解释是,逻辑不对。
" 世界模型比机器人的操作模型要复杂得多。如果说我们都能够非常好地去模拟这个世界,那它里面几乎已经蕴含了世界的所有知识。你想,先解决一个更难的问题,然后你就能解决那个简单的问题了?"
也就是说,这相当于为了教机器人拧螺丝,先去把整个工厂的物理法则都复刻一遍,代价太大,也不现实。
原力灵机的做法很巧妙:他们也有一个世界模型,但它不是被当作一个完美的 " 模拟器 " 来直接驱动决策,而是在训练过程中,被当成一个 " 陪练 " 和 " 强化监督信号 "。
简单说,就是在训练机器人操作能力时,让它在那个 " 虽不完美但够用 " 的世界模型里先 " 演练 " 一遍,用这个虚拟结果作为反馈,持续修正操作模型。
但在机器人真正干活时,并不需要一边预测世界一边行动,只需要跑那一小部分执行模块,干脆利落。
这套技术路线,没有追逐 " 世界模型 " 的风口,而是基于他们对问题本质的判断:先让机器人能干活,同时在训练中引入对世界的理解作为辅助。

团队将这个过程戏称为 " 炼丹 "。
这个词不是现在才有的,早在 2012、2013 年在旷视训练深度学习模型时,大家就开始说了。
" 你不知道最后炖出来是什么效果,东西先丢进去,但炼丹也是个手艺活。"
十几年过去,这个词从一个内部玩笑变成了技术人的自嘲。
原力灵机的代码库里,有一个项目名字就叫 " 铁锅炖 ",联合创始人汪天才他们起的。
唐文斌第一次看到 TGD 这个缩写时问是什么意思,答曰:铁锅炖。他觉得挺逗,就保留了。
而这种扁平化、略带极客幽默感的氛围,是唐文斌刻意维持的。
务实的理想主义者
在金隅智造工场的两层楼里,唐文斌没有独立办公室,工位和普通员工在一起。
联合创始人也是同样待遇,散落在团队中间,像没有特殊标记的 NPC。
如果你想找他们,直接走过去就好。
整个办公区通透而简单,一如他们的沟通方式。
而如果仔细看会议室的标牌,会发现它们各有来头:
Flow 来自《心灵奇旅》,Matrix 是《黑客帝国》,Red Queen 是《爱丽丝梦游仙境》里那个叫嚷着 " 砍掉他们的脑袋 " 的红桃皇后,Jarvis 是钢铁侠的 AI 管家。

在经历了行业起伏、从巅峰到低谷的完整周期后,再次出发的唐文斌和他身边的 " 新三剑客 " ——范浩强、周而进、汪天才——选择了一条更安静、也更 tough 的路。
核心团队颇为年轻:唐文斌 1987 年出生,范浩强 1994 年,周而进 1992 年,汪天才 1994 年。汪天才的名字的确名副其实——他曾在某一年入选过全球前 2% 科学家榜单。
这四个人都是旷视的老员工,一起经历过从计算机视觉到具身智能的范式转移。他们为什么愿意再次聚到唐文斌身边?
联合创始人范浩强最直观的感受是 " 太拼了 "。他说唐文斌可能是公司里工作时长最长的人,没有之一。
" 各个大大小小、内内外外的事情都能一把挑起来,并哪怕非常忙,依然在做每件事的时候还能倾注百分百的热情。"
他觉得,是唐文斌对机器人这件事心里有足够强的信念,所以才能驱动自己像个 " 铁人 " 一样。
周而进用的词是 " 真诚且务实 "。共事多年,他认为唐文斌的风格是实事求是,事情是怎样就怎样,该怎么解决就怎么解决。
" 大家也不是第一次创业,都知道创业过程中要经历哪些坎,哪些东西该扎实完成,哪些东西该给客户创造价值。文斌在这些事情上非常务实。"
汪天才则认为唐文斌是 " 开放且务实 " 的。他解释说,开放在于 " 什么都可以聊 ",员工的意见和看法都能直接提,唐文斌会从不同视角去吸收和讨论。
而务实的一体两面则体现在赛道选择上," 不是一个纯讲故事的心态。投资人想听什么就讲什么,他不搞花里胡哨那一套。"
这群人聚在一起的底层原因,范浩强用了一个词总结:信仰。
在采访中,团队反复提到这个词。
"2020 年,那个时候讲端到端是很困难的,不管是研发层面还是让别人相信。我们被拒绝了很多次,paper 被拒,方案被质疑。但你内心不信,你是无法坚持的。"
汪天才把这种逻辑迁移到了机器人上:" 从数字世界到物理世界,从开环走向闭环。自驾并不会直接改变物理世界,除非发生车祸。但具身智能时时刻刻都在与物理世界交互,导航也好,操作也好,闭环程度远超自驾。"
范浩强把团队的凝聚力,归为一个很纯粹的理由:" 一群有情有义的人,去干一件有意义的事情。"
他说,强的同学都更喜欢跟强的同学合作,而具身智能这件事本身就足够有挑战性,也足够让人兴奋。
一个人能让一群比他只年轻几岁的天才心甘情愿地跟随,没有靠职位、画饼,靠的是他们说的这些——拼、真诚、开放。还有最重要的:他自己的信念。
唐文斌给自己的定义是:一个务实的理想主义者。
" 我自己是个比较简单的人,不太能讲很多我不信的话," 他说," 团队内部也崇尚一种简单直接的沟通文化,这其实是一帮技术同学想要追求的环境。"
100 万台机器人
打开原力灵机官网,很显眼的一行字跳了出来:Build Intelligent, Useful, and Trustworthy Robots for A Better Life(打造智能的、有用的、可信赖的机器人,让生活更美好)。
三个形容词,对应三个维度:智能,是大脑能力;有用,是生产力价值;可信赖,是安全性和可靠性。
对于未来,唐文斌的目标明确:十年内,至少打造一个县城级别的生产能力。
他的老家在浙江新昌,40 万人口。" 假设三个机器人能产生一个人的生产力,我们希望至少打造 100 万台机器人在持续被使用的状态。"
他特意强调," 不是卖出去 100 万台,是 100 万台真正在被使用。"
卖出去和用起来,就像 demo 和产品,是两回事。
唐文斌了解这之间的距离。
他经历过旷视从实验室到产业的完整周期,知道一个技术从 " 能 work" 到 " 能用 " 再到 " 好用 " 之间,存在很多次推倒重来。
公司名字 Dexmal,Dex 来自 Dexterity(灵巧),mal 来自 Animal(生物),他希望机器人能像生物一样灵巧和多形态。
会议室 Baymax 的名字,取自电影《超能陆战队》里的大白——一个充气机器人,笨拙、柔软、可靠、温暖。
电影主题曲里有句歌词:我将忠诚守护,你那炽热的梦想。

这大概就是这群人想做的东西:
打造智能的、有用的、可信赖的机器人,让它们真正关心人类的生活,解决那些繁琐的、危险的、人类不想做的事情。
让人类进入一个生产力极大富足的时代,去探索更广阔的星辰大海。
当被问到机器人融入现实世界,是否预示着终结者时代的来临时,唐文斌笑了:有可能。
然后他补充说:" 整个技术发展的斜率越来越陡。我们身处局中,但它的发展依然超出我们的预期。这是一个非常令人兴奋的时代,我们很感谢能生在这样一个时代。"
窗外,北京的春天正在发生。会议室 Red Queen 隔壁,程序员们对着屏幕敲代码。
DM0 的下一个版本即将发布,评测榜单上的排名会被再次刷新。

唐文斌的工位铭牌,名字下边只有一行字:twb@dexmal.com。
没有 title,没有成就。
和他在公司里的工位一样,不需要任何额外的标注。
Flow ——一个会议室的名字,也是一个概念:流动,变化,持续向前。
这大概就是他们相信的东西。
不是你现在在哪里,而是你在向哪里流动,以及,有多快。
原力灵机北京的金隅智造工场外,几个背着双肩包的年轻工程师,骑着自行车,呼啸而过。
也许在未来的某一天,这条路上会有一个机器人正在清扫街道,或是驾驶着一辆货车驶过……
那时的它,会如何看待眼前的世界?
是计算路面的摩擦力,评估风阻对能耗的影响,还是像人类一样感受一阵风穿过树叶的轻柔?
阳光之下,是真实、复杂、亟待被新技术改变的物理世界。
而屋内这群人正在做的,或许可以被看作是一种漫长而耐心的翻译工作——将人类关于智慧与行动的朦胧想象,翻译成一行行能被机器读取并执行的代码。
他们不知道自己最终会翻译出什么。
就像当年的 " 炼丹 ",东西丢进去,不知出来的是什么,但有人愿意一直守在炉子旁边。
也没有人知道,当这些代码最终苏醒,理解杯子不只是像素和力矩的组合,而是某种可以被递出的善意时——它会如何描述这个春天?
或许它什么都不会说。
只是安静地,把一杯水端稳。
(绿岛邻事业部北京区域经理赵珊珊对此文亦有贡献)
排版 | 木棉
审校 | 豆汁儿 主编 | 孙允广