文 | 定焦 One,作者 | 王璐,编辑 | 魏佳
人类,正在被人形机器人 " 圈粉 "。
在刚刚落幕的 2025 世界机器人大会(WRC)上,这群 " 钢铁战士 " 成了顶流明星,五天展期里人潮不散,各家展台被围得水泄不通,观众一边惊呼 " 哇塞 ",一边举着手机咔咔狂拍,社交平台被机器人的短视频刷屏。
越来越多人惊喜于人形机器人的进化速度,它们已经不是笨拙的铁疙瘩,而是有了灵巧的双手和双足,皮肤触感逼真到能 " 以假乱真 ",甚至会挑眉、微笑、抛媚眼。
技能点也在全方位进化——
能表演:跳舞、T 台走秀、打拳、踢足球等样样精通;
能干活:在家务整理、咖啡制作、工业搬运等领域取代打工人;
能交流:听得懂人讲话、能进行简单地自然对话,逐步摆脱 " 人工智障 " 标签。
但它们也有不少 bug ——
动作单一:多家厂商机器人跳舞,后空翻和摔倒姿势宛如复制粘贴,被网友调侃 " 程序员偷懒 ";
效率不高:叠衣服慢如树懒,工业场景仍停留在基础分拣;
价格高昂:一台顶配机器人抵得上一辆宝马。
尽管如此,它们仍跌跌撞撞地离开实验室,正在加速走向现实世界。" 马拉松 "" 运动会 "" 拳击赛 " 等各种人形机器人赛事,还在霸屏着国内外媒体。
近期,「定焦 One」和几位人形机器人头部企业、资深从业者聊了聊。虽然现在谈大规模应用还为时尚早," 智力 " 和 " 成本 " 仍是瓶颈,但技术进步、资本下注和市场需求正在加速这个进程。未来,人形机器人可能会颠覆我们对劳动、效率和智能的想象。
人形机器人,进化成啥样了?
人形机器人,到底是什么样的存在?它并不像大家想象中那么简单。我们从外观、交互方式和应用场景三方面,来一个全景认知。
先来看看如今的人形机器人长什么样。
通常来说,它们有着躯干、头颈、四肢等类人结构,但实际上,各家的人形机器人形态各异,差异主要体现在手和脚的设计上。手分为三类:灵巧手(采用仿生五指设计,能够模拟人类手部的精细动作)和二指夹爪、三指手,脚则分为双足型和非足型。
在从业者看来,虽然灵巧手和双足设计更接近人类形态,但实现功能却相对基础且价格高昂,一位相关从业者透露,高端灵巧手价格高达 10 万 -20 万元。
有着多年互联网和自动驾驶汽车行业从业经验,也是具身智能行业的资深从业者 Kris 告诉「定焦 One」,一对灵巧手的成本可以占到机器人总成本的三分之一,从二指夹爪升级为三指手,虽然只增加了一个手指,成本可能翻了好几倍,但高成本带来的效果未必成正比。
因此,为了提供更好性能以及平衡性价比,人形机器人公司大多都采取了没那么像人的夹爪形式和轮式结构,除非客户有特定需求。
比如,参展厂商星尘智能的 Astribot S1 演示了做早餐、冲咖啡、画扇子等复杂任务,这些操作都是靠二指夹爪实现的。
星尘智能研发负责人安昭辉告诉「定焦 One」,人形机器人的操作功能集中在上半身,但不仅仅是靠夹爪,而是依靠整个上半身,所以他们对整个机器人本体的关键部位,采用了创新绳驱传动设计,达到了高度模仿人类肌肉和施力方式,而且在表现更拟人、更高动态的同时,也更安全。
再来看交互方式,Kris 解释,控制人形机器人运行的方法主要有三种:遥操(通过传感器、控制器等设备捕捉人类动作)、同构臂(通过关节映射传递到机器人手臂)、语音控制三类。其中比较复杂的指令比如做早餐,采用的便是遥操、同构臂,简单的指令比如推、拿、放,采用的是语音控制甚至可以达到自主运行。
但无论哪种,离真正由 AI 自主控制都相差很远。即使是看似智能的 " 语音控制 ",也多基于预设规则,机器人只是看上去有了自主意识,但缺乏真正的场景适应能力。
需要指出的是,人形机器人的遥操和遥控车不是一个概念,也需要一定技术水平。
北京大学计算机学院访问工程师,在互联网、自动驾驶、机器人等行业都拥有丰富实践经验的 gashero 向「定焦 One」解释,人形机器人看上去是有人拿着遥控器进行操作,但遥操实际上发送的是指令,而非直接控制机器人的最底层,还有大量子任务需要机器人自己规划执行。比如需要机器人自己保持平衡,规划身上的多个电机、传感器来综合执行目标动作,具有技术难度。
最后来看看应用场景。
综合从业者的观点,人形机器人可清晰地分为To B(企业级)和 To C(消费级)两大方向,其中 To B 主要指的是文娱表演、工业制造、文旅服务、医疗康养这四大领域。To C 集中在家用场景,Kris 总结,人形机器人的目标是替代传统的 " 三保 " 工作(保安、保洁、保姆)。
Kris 表示,文娱表演是目前最为成熟的应用场景,各种舞蹈、T 台走秀和竞技比赛频繁出现。而其他场景仍处于基础应用阶段,比如工业制造以流水线上的分拣、搬运为主,文旅服务以景区引导为主。
不过,从实际价值来看,gashero 认为现阶段很多人形机器人 " 上班 " 后的存在感并不强。
比如在仓库里完成搬箱子任务,仓库 AGV 机器人(机器视觉 + 机械臂的组合)已经非常成熟且廉价,人形机器人不具备强竞争力。至于文娱表演,他认为不可持续," 新鲜劲过了,机器人还是要追求创造实实在在的价值。"
总结来说,虽然人形机器人这几年有了很大进步,但想让它们真正发挥价值,还有几道关键门槛。
得过 " 成本关 " 和 " 脑子关 "
多位从业者概括,眼下人形机器人的主要难题在于 " 脑子不够聪明 " 和 " 价格不够亲民 "。
你可以把人形机器人想象成一个 " 人 ",由 " 身体 " 和 " 脑子 " 组成。硬件就是它的 " 身体 ",也被从业者叫做本体,软件则是它的 " 脑子 ",掌管着各种思考和行动。
业界的共识是,国内人形机器人的运动性能已经日趋成熟,可以满足基本的操作需求,但比起 " 身体 " 的强壮,人形机器人 " 脑子 " 的问题很大,目前行业智能化发展严重不均。Kris 直言,人形机器人的软件还停留在 Demo 水平,就像是个刚学会走路的孩子,只能在特定的小范围里走路。
大语言模型之所以越来越聪明,是因为它不停地学习海量数据。人形机器人也类似,但它得在真实的物理环境中进行大量交互操作,从中获取数据来训练自己的决策和行动能力。可现实是,物理世界的操作数据非常短缺,严重限制了人形机器人的发展。
Kris 表示,人形机器人的软件构成基本都是 VLA 的架构,在这个架构下,要让 " 脑子 " 认出物体,还要指挥 " 身体 " 完成动作,就必须依赖精准真实的空间数据。
比如,让人形机器人去晾衣服,它得知道走到哪儿去晾,那个地方的具体坐标是多少。可现实生活中这部分数据偏偏是缺失的。所以很多人形机器人在完成指定动作时,必须固定在某个地方,拿的东西也必须在它的视线之内,就像被无形的绳子拴住了一样。
但有些人形机器人的智商已经出现了进化。
比如在 " 收拾桌面 " 的家务场景中,星尘智能的 Astribot S1(依托星尘智能全身 VLA 模型)在面对很多没见过的物体或异常干扰时,能自主完成收拾杂物的工作,即使将场景挪到 WRC 现场,也只需补采少量数据,模型就能用。
这背后依靠的是自研模型、本体、过往海量数据的闭环驱动,而其 " 元技能库 " 学习法,可以让机器人不断采集各类场景中的交互信息,面对新任务时进行技能迁移,无需从头学起,就像小朋友学习一样,通过举一反三认知世界。
但安昭辉也告诉「定焦 One」,目前人形机器人的通用泛化能力还是整个行业都在头疼的难题,目前它只能对相似的场景进行泛化,做不到像 ChatGPT 那样回答各行各业的问题,简言之,它还是个垂类专家而非通用专家。
不止一位从业者表示,合成数据是推动具身智能快速落地的关键。以银河通用为代表的企业在具身智能领域专注研究,在 " 脑子 " 上达到行业前沿水平。
拿银河通用的 Galbot 为例,在北京海淀中关村的线下门店,它不用人遥操作,便可自主完成购买接待、点单支付、商品拿取、当面交付、多语音交互引客等全流程。在面对 300+ 冷藏 / 热饮不同形态的商品时,也能准确抓取且做到不碰倒其他货品。
在本次 WRC 大会上,英伟达 Omniverse 和仿真模拟技术副总裁 Rev Lebaredian 和宇树科技王兴兴、银河通用创始人王鹤同框,英伟达宣布已将中国首批 Jetson Thor 芯片给银河通用使用。在银河通用的 WRC 展台上展示了全球首款搭载了英伟达 Jetson Thor 芯片的机器人 Galbot G1 Premium,被现场观众评价为 " 干活最麻利的人形机器人 "。
如果说 " 脑子关 " 限制了人形机器人的能力,那么 " 成本关 " 则决定了它能否大规模普及。
在本次 WRC 大会上,人形机器人的身价天差地别,但整体都价格不菲,大部分在几十万的区间。最贵的一台将近百万,被网友调侃为 " 土豪专属 ",当然,也有少数 " 亲民款 ",比如宇树科技 Unitree G1 人形机器人,售价 9.9 万元,但对普通家庭来说仍不算便宜。
高昂的价格让人望而却步,从业者解释,这并非漫天要价,事实是,造一台人形机器人成本很高。机器人领域很多核心零部件的成本和汽车产业类似,甚至连供应商都是同一拨,硬件成本不低,也让机器人短期内难以像其他家电那样进入千家万户。
比商业化更快的,是上市潮先来了
即便人形机器人面临着智力与成本的双重考验,对于这一行业的前景,市场仍十分看好。
从宏观数据看,行业规模正高速增长。本次 2025 世界机器人大会开幕式上公布了一组数据:今年上半年,我国机器人产业营收同比增长 27.8%。工业机器人和服务机器人产量增长同样显著,同比分别增长 35.6% 和 25.5%。我国已连续 12 年位居全球最大工业机器人应用市场。
企业端和资本端的热度更胜一筹。
企查查数据显示,截至目前,今年前 7 个月已注册机器人相关企业 15.28 万家,较去年同期相比,增长 43.81%,增速远超去年全年注册水平。截至 8 月 12 日,国内现存机器人相关企业 95.8 万家。
与此同时,很多企业已经瞄准了资本市场。公开信息显示,目前全球已有超 20 家人形机器人公司启动 IPO 或传出有 IPO 意向,其中中国占 16 家,包括宇树科技、智元机器人、傅利叶智能等。
各家聚焦的应用场景和优势也都不一样。
比如宇树科技的优势集中在核心技术与商业化落地能力上。其 95% 以上的核心硬件实现自主研发,在商业化方面,旗下产品 G1 基础版以 9.9 万元起的售价展现出高性价比,落地应用已较为成熟。
智元机器人则主打全链条布局。从硬件到软件均坚持自主研发,同时通过投资机器人产业链上的多家创业公司,构建起产业生态。
傅利叶智能聚焦特定场景深耕,重点发力医疗康复领域。最近推出了首款主打交互陪伴、具备 " 可触摸 " 特性的全尺寸人形 Care-bot GR-3,其具有社交陪伴和辅助陪护功能,整体外观形似 " 大白 ",还有微表情反馈。
至于如何判断一家人形机器人公司的实力,不同从业者给出了不同参考标准。
gashero 认为人形机器人和自动驾驶领域具有一定的相似性,因此也可借鉴其评估方式,先把这些公司进行分类,划分为人工智能(具身智能)和机器人两大派。人工智能派致力于 " 大脑 " ——更高的智能水平,机器人派则侧重于 " 身体 " ——更强的硬件能力。
在这两派中,gashero 认为," 大脑 " 是人形机器人在未来突破的关键所在,因此更倾向于将数据方面具备更强实力的公司放进第一梯队。
Kris 则强调,落地场景对于人形机器人的商业前景起着决定性作用。但如果从这一维度来看,企业梯队划分又会呈现出明显差异,因此他更偏向于认为行业还处在发展早期,人形机器人公司各自在不同的应用领域探索、拓展市场,很难从某一固定维度分出高下。
也有从业者认为,依据估值来划分人形机器人公司的实力,是一种较为直观的方法。
按照这种划分方式,智元机器人、宇树科技、银河通用处于第一梯队,估值超 70 亿;它石智航、千寻智能、自变量机器人等公司排在第二梯队,估值在 20 亿 -50 亿;其余热门公司估值大致在 20 亿以下。
不难发现,无论是从 " 大脑 " 与 " 身体 " 的技术侧重,还是落地场景的探索,以及估值规模的评估,不同的维度展现出市场看待人形机器人行业的多元视角,恰恰显示出这是一个高速生长、远未定型的行业。这也意味着,人形机器人的未来,将有无限可能。