把一台人形机器人拆开,你会看到什么

Table of Contents

🤖 AI 摘要 今年春晚机器人还能空翻、打武术,连手机厂商做出来的机器人都在半马上破了人类记录。但如果你把一台人形机器人拆开看,会发现这些花哨动作背后的硬件系统,远比想象中复杂。本文从骨架材料、关节执行器、传感器到电气架构,系统拆解人形机器人的四大硬件系统,搞清楚它们各自的技术难点、供应链现状,以及为什么"能动"和"好用"之间还隔着巨大鸿沟。

🔑 核心要点 1、执行器占整机成本过半 2、减速器是最难的标准件 3、传感器规格与自动驾驶截然不同 4、供应链成熟是这两年进化的隐性能手 5、系统级整合是真正的壁垒


去年春晚,机器人还在转手绢、扭秧歌。今年已经能空翻、打武术了。宇树刚过会科创板,又端出了载人变形机甲,连手机厂商做的机器人都在半马上破了人类记录。

看起来进化飞快,但如果把一台人形机器人拆开看,你会发现自己面对的是一个极其精密的工程系统——远不是一个"智能大脑装进铁壳子"那么简单。

人形机器人的硬件可以粗略分成四大系统:骨架关节传感器电气与计算。这四个系统缺一不可,任何一个短板都会导致机器人要么动不了,要么站不稳,要么像个傻子。

下面逐一拆开。

骨架:轻到能翻跟头,硬到扛得住摔

第一台全尺寸机器人WABOT-1,纯钢结构,体重160公斤——跳一下能把地板砸个坑,翻跟头想都别想。

后来的进化主线就是减重:本田ASIMO、波士顿动力早期Atlas、第一代特斯拉Optimus都转向了铝合金,密度只有钢的三分之一。现在行业正在往镁合金迁移——密度比铝再低三分之一,局部还会用钛合金来扛高频冲击。

骨架材料的选择本质上是在两个矛盾需求之间找平衡:要轻才能翻起来,要硬才能扛得住

后空翻对关节的冲击力相当于车祸级别。一次空翻下来,骨骼不仅要没裂,还得保持结构精度不变。这就要求材料既轻又硬,还得有足够的韧性——纯硬不行,太脆了。

除了主骨架,还有两类"外皮":

装饰保护件——胸部、背部、头部的外壳,从塑料到仿皮TPU到织物都有。有些机器人看起来是金属机身,实际上是塑料外壳镀了一层金属漆。

仿生皮肤——不只是看起来像人,还要求触感像人,而且皮下要植入触觉传感器,让机器人能感受到压力和摩擦。这是目前技术成熟度最低的部分。

骨架部分的供应链相对成熟,利润空间也薄,技术壁垒主要不在这里。但它反映了一个设计信号:选什么材料、用哪种加工工艺,能看出一家机器人公司的工程功底。

关节执行器:整台机器人的成本大头和技术核心

如果说骨架是机器人的骨骼,那关节就是肌肉和筋腱——也是最贵、最难的部分。

根据美国银行的测算,执行器占了整机成本的51%。理解执行器,基本就理解了人形机器人硬件的大半壁江山。

两种基本形态

机器人身上的关节分两种:

旋转执行器——像人的肩关节、肘关节。核心结构是"伺服电机+减速器"。电机负责转,减速器负责把高转速降下来、把低扭矩提上去。举个直观的例子:电机每分钟上万转,但扭矩很小;机器人肩关节需要慢慢转但搬得起重物。减速器就是完成这个转换的装置,原理类似自行车的变速齿轮。

肩膀有三个自由度(前后摆、上下抬、内外旋),专业术语叫俯仰(pitch)、滚转(roll)、偏航(yaw),需要三个旋转执行器组合才能实现三维自由运动。膝关节通常只需要一个自由度,一个旋转或直线执行器就够了。

直线执行器——更像人体肌肉,通过推拉带动骨骼。核心结构是"伺服电机+丝杠"。丝杠把旋转变成直线运动,原理跟拧螺丝一样。用在膝关节、手腕、脚踝等部位。

减速器:关节里最难啃的骨头

减速器是整个执行器里加工难度最高的部件。为什么?因为它极度精密,而且面对长期磨损,很难保证一致性。

行业有三种主流减速器,适用场景完全不同:

行星减速器——电机连中心齿轮,带动行星轮再带动外圈齿轮,结构简单成本低。但减速比小,输出扭矩有限,一般用在手部关节,对力量要求不高。

谐波减速器——这个设计很巧妙:中心是"波发生器",把一个柔性齿轮(柔轮)撑成椭圆形。柔轮和外部固定齿轮(刚轮)之间只差2齿,波发生器转一圈,柔轮只走2齿。减速比可以做到非常大,而且精度高,适合用在肩关节、肘关节这种需要精准控制的部位。

但谐波减速器有个致命弱点:柔性结构抗冲击差。做后空翻时的冲击力能把它打坏。

RV减速器——两级减速结构,多齿同时啮合,刚性好、抗冲击强。用在髋关节、膝关节、腰部这些高频承受冲击的部位。结构更复杂,成本也更高。

造一个减速器不难,难的是造出一万个性能一致、耐久可靠的减速器。加工公差、材料热处理、装配工艺……任何一个环节的波动都会导致批次差异。这不是算法能弥补的,是实打实的制造工程问题。

丝杠:直线运动的核心

丝杠有三种:滚珠丝杠最常见,滚柱丝杠寿命更长承载更高,T型丝杠用于低端场景。直线执行器目前在机器人上的应用还不多,主要因为动态性能差、制造难、成本高。但精操作能力要求越来越高,这是一个明确的增长方向。

电机:不只是"转起来"那么简单

关节里用的是无框力矩电机——去掉了外壳和轴承,只保留核心部件,直接塞进关节内部。灵巧手用的是更小的空心杯电机。

电机的三道核心坎:

能效与散热——空翻时瞬时电流是平时的3-5倍,发热量是额定状态的9-25倍。温度从10度温升直接跳到50度,做完动作得冷却才能继续。目前主要靠机身金属被动散热,高功率关节才加风冷或液冷。3%和5%的能效差距,在极限工况下就是"翻过去"和"摔下来"的区别。

体积限制——电机越小,转动惯量越小,改变运动状态越快。想象一下甩一根短绳和长绳——短绳转速快、停得也快;长绳想停都停不下来。体积对控制精度的影响就这么大。

TN曲线稳定性——给定电流下,电机转速和输出扭矩的关系曲线。这条曲线如果不稳定,同样的控制指令会得到不同的输出——仿真里训练得再好,放到真机上也会偏差。这对依赖仿真训练的机器人算法来说是根本性的问题。

伺服系统:让电机听话的指挥链

光有电机不够,还需要一套伺服系统让它精确执行指令:

  • 编码器——告诉系统电机当前转到了什么角度、速度多少
  • 驱动器——根据编码器反馈和控制指令,调节电压电流
  • 力矩传感器——测输出扭矩
  • 温度传感器——防止过热

这个闭环链条以每秒上千次的频率运行。走过不平整的路面时,脚踝的力矩传感器感受到起伏,系统瞬间调整电流控制扭矩维持平衡——整个响应在几毫秒内完成。

自研还是采购?

头部公司几乎都在自研执行器。不是买不到,而是执行器的参数直接决定控制算法的表现——电机特性、减速比、传感器灵敏度……这些参数必须跟算法深度耦合。用采购件,你调算法的余地就小了。

传感器:让机器人知道自己在哪

传感器负责两件事:维持自身平衡感知外部世界

维持平衡:IMU和关节反馈

机器人为什么不容易摔倒?靠两套感知系统并行工作:

关节内部的伺服系统——编码器和力矩传感器实时感知每个关节的状态,以每秒上千次的频率微调输出。相当于机器人的"本体感觉"。

IMU(惯性测量单元)——相当于人的前庭系统(内耳),由加速度计、陀螺仪和磁力计组成。踹它一脚,IMU瞬间检测到加速度变化和身体倾斜,数据传给小脑,计算补偿扭矩,把身体拉回来。

IMU在手机和汽车里大量使用,技术非常成熟,不是瓶颈。

感知外部世界:视觉系统

机器人的视觉方案跟自动驾驶高度相似——摄像头+激光雷达+毫米波雷达的多传感器融合。特斯拉Optimus是例外,坚持纯视觉路线。

机器人的传感器规格和汽车截然不同,四个关键差异:

测距——汽车在高速上跑,激光雷达要看150-200米;机器人主要在室内,10-20米就够。这意味着机器人的雷达可以用更低的功率、更小的体积、更低的成本。

点云密度——汽车识别的是车、人、路障这些大物体,点云密度可以低;机器人要在桌上拿螺丝刀、地上捡硬币,需要高密度点云才能识别小物体。

体积——车顶装个拳头大的雷达无所谓,机器人身体小,雷达必须微型化。

可靠性——汽车怕极端温度,机器人更怕冲击震动——毕竟空翻的冲击力是持续的。

汽车激光雷达成熟不代表机器人激光雷达成熟。后者还需要专门的微型化、高密度方案,目前还处于早期阶段。

触觉:最后的感知缺口

触觉是目前机器人感知系统中最薄弱的环节。

四种技术路线并行探索:压阻式(压力变电阻)、电容式(间距变电容)、压电式(受力生电)、光学式(弹性材料形变+摄像头捕捉)。

光学式是当前最热门的方向,因为能实现三维感知——不仅感受到压力,还能感知滑动摩擦。比如拿起一个玻璃杯,手指要感受到杯壁的滑动趋势后加大握力防止脱手。这种力觉反馈对精操作至关重要。

此前的量产机器人几乎不搭载触觉。但2026年被业内视为触觉规模化量产的转折年。如果实现,这将是机器人从"能搬东西"到"能精细操作"的关键一步。

电气与计算:机器人的中枢神经系统

“大脑"与"小脑"的双芯片架构

机器人不用一个芯片干所有事,因为需求完全矛盾:

大脑芯片负责"思考”——识别物体、理解指令、规划路径。需要高算力、大内存,最好能端侧跑大模型,延迟几秒问题不大。主流选择是英伟达Orin,2025年推出的Thor芯片专为机器人和物理AI设计。高通也在CES上发布了Dragonwing IQ10,宣布与Figure合作。特斯拉走自研路线,双芯片设计。

小脑芯片负责"运动"——实时协调关节、维持平衡、处理反馈。算力要求不高,但实时性和稳定性是生死线,延迟几毫秒就可能摔倒。主流是MCU级别芯片:意法半导体的STM32、恩智浦的i.MX RT、瑞萨的RZ系列。

空翻和跳舞动作通常是预录好的,但你会发现机器人的脚会有细微的碎步调整——那就是小脑在做动态平衡,类似人类的本能反应。

行业趋势是把大脑小脑集成到一块芯片上。特斯拉一开始就走这条路,灵境智源今年3月发布了"德沃夏克架构",在一块芯片上实现了大脑-小脑-皮层的三功能集成。但这个方向还非常早期。

电池与线束

电池核心诉求是高能量密度、小体积,供应商与新能源汽车高度重合(宁德时代、LG、亿纬锂能)。线束负责全身通信供电(立讯精密、TE Connectivity等),技术相对成熟。

量产难题:能动不等于好用

如果你认识所有供应商,理论上可以自己组装一台机器人。但"能动"和"好用"之间隔着的,是系统级整合的巨大鸿沟。

几个真实的问题:

重量分布不均——组装后重心偏移,走路时某些关节额外出力→功耗增加→续航缩短→步态不稳。微小的重心偏差会在动态运动中被放大。

一致性——每台机器人的关节背隙、传感器零点、电机参数都不一样。同一套算法部署到不同批次的本体上,表现可能差很多。要做商业化量产,就得让第1台和第1000台表现基本一致。

耐久性——实验室跑1小时没问题,真实环境跑100小时:螺丝松了、线磨损了、润滑脂干了、传感器漂移了。这些"细碎"的工程问题,每解决一个都需要大量迭代。

这才是机器人公司的真正壁垒。不是某个零件的技术含量,而是把所有零件组装在一起后,还能稳定、一致、耐久地运行。

供应链:这两年进化加速的隐性推手

人形机器人这两年的进化速度确实惊人——从走路到转手绢,从跳舞到空翻,进步肉眼可见。

但驱动这一切的,不是某项突然突破的单一技术,而是供应链的成熟

机器人产业链跟汽车高度重合:电机、芯片、电池、传感器——很多供应商本来就在给汽车供货。之前的问题是:机器人市场太小,供应商不愿意专门开模定制,优先保障成熟的汽车和手机业务。

现在情况变了。机器人赛道热了,供应商开始投入。供应链一旦开始滚动,就像滚雪球——需求越大→供应商越愿意投入→产品越好→成本越低→需求更大。这是这两年机器人进化加速的底层逻辑。

但这也意味着,机器人硬件的差异化会越来越难。当所有公司都能从同一批供应商买到类似规格的零部件时,系统整合能力就成了唯一的分水岭

下一个里程碑:接住一片落叶

原文结尾有个画面感很强的比喻:机器人的下一个里程碑不是更花哨的动作,而是"接住一片落叶"。

想象这个场景:一阵风过,落叶从树梢飘下,轨迹不规则、速度多变、面积极小。机器人要完成这个动作,需要:

  • 视觉系统在复杂背景中精准追踪一片薄薄的落叶
  • 大脑在极短时间内预测落点(考虑风速、旋转、空气阻力)
  • 小脑规划手臂运动轨迹,精确到几厘米的拦截点
  • 手指在接触瞬间以恰到好处的力度捏住——太轻了接不住,太重了会碾碎
  • 触觉传感器反馈叶片在手心的压力分布,微调握力

这对人类来说是本能。对机器人来说,是视觉、运动控制、力觉反馈三大系统的深度融合——而这三者之间的协同,恰恰是当前最大的技术空白。

空翻是力量的极致,落叶是感知与控制的极致。力量可以靠堆材料和功率解决,感知与控制只能靠算法和数据的长期积累。

当机器人能接住一片落叶的时候,它才真正从"一台精密的机器"变成了"一个有身体智能的个体"。而那一天的距离,可能比我们想象的更远。


参考来源: