2025年11月15日
小鹏人形机器人 IRON 通过突破自由度和仿生外覆层设计,向人类步态和外形迈进。本文将围绕头部、肩部、腰部、膝关节、手部、电池及“仿生肌肉”等关键模块。探讨其设计亮点与技术瓶颈。
本文素材源于ScottWalter,翻译而来有删改仅供参考,可在上方查看原视频。
https://www.youtube.com/watch?v=ITz8WepEBz0
真假质疑

Scott:本体造型借鉴古希腊雕塑,步态是典型的走秀步伐,一脚跨到另一脚正前方,整体观感非常接近真人行走。
再结合马斯克提过的“V3 会像穿着机甲的人类”的说法,小鹏这次等于是抢先做了一次“像真人”的公开实验。

Scott:为了解除争议,会后他们又放出了剪开外覆层的视频:把外层“皮”剪开之后,可以清楚看到下面是一整台机器人本体。
Scott:随后给出的结构示意图,让我们大致看清了内部布局:手部并不是腱绳驱动,而是在各个指间(IP)关节处直接驱动。如果真是这样,工程上非常不简单。画面里还可以看到腰部和锁骨/肩胛骨区域的结构,为后续分析肩部和腰部自由度提供了线索。

Scott:于是我把他们的一张图叠到另一张图上做了个对比,关键部位基本都能对得上,这说明这套骨架确实可以“塞进”那层外覆盖,这一点问题不大。
头部

Scott:先看一下头部。虽然他们没给太多头部内部结构的细节,但根据现有图片,我大致能做一些推断。我一直在想,这里到底有没有 Z 轴(绕竖直方向的旋转)。从我们手头的其他视角来看,其实很难直接看到一个清晰的 Z 轴结构;接下来你会看到,我基本可以确定这里有一个 Y 轴,而 Z 轴大概率是藏在下面这一带。
如果没有 Z 轴,那简直是大忌——等于你没有“摇头说不”的自由度,没法左右转头。正常情况下,你既希望头能左右转,也希望能上下点,这对跟踪目标、观察环境非常关键。所以,如果他们真没做这个自由度,那会非常让人震惊;也正因为如此,我几乎可以肯定:这个自由度一定在里面。

基于这些图,我的判断是:它大概是先 Z 旋转,然后是一个 Y,再接着是 X 和 Y,也就是一个 Z–Y–X–Y 的组合。我把中间那段 XY 写在一起,是因为那一段是个并联机构。本质上,它就是一个 SPU 机构——球铰(S)+ 伸缩副(P)+ 万向节(U)的组合,这种结构在手腕和脚踝上很常见。
这意味着这是一个四自由度的头部。一般情况下,头部做到两个自由度就够用,讲究一点做到三个就已经不错了——他们为什么要做到四个?部分原因很可能是:他们需要一个很自然的 X 轴点头自由度,而出于某些设计考量,宁愿用这种并联方式来实现,而不是在那儿再单独加一颗执行器。
另外,他们几乎是用线性执行器来“构成”脖子及相关机构,这样顺带又给了他们一个第二个 Y 轴:一个在颈部底部,另一个在更上方一点。这样一来,机器人在做“前倾”动作时,会更像人类——不是单纯把下巴往下压,而是整个脖子微微向前探。

Scott:这是肩部。拆开看,可以看到这里有肩部的旋转自由度,屈曲/伸展自由度,外展/内收自由度——这些是肩关节本来应该有的基础自由度。问题是:既然这些基础自由度已经有了,为什么还要加这么多额外的结构,且放得这么靠外?
这套机构通过“拥抱 + 耸肩”设计,赋予机器人做出“抱一抱、耸耸肩”动作的能力,增加了两个自由度,让整条手臂可以看作有9 个自由度。
另外,这套机构并不对称,左侧和右侧的布局略有不同,这可能导致在某些任务中更偏向使用某一侧,具有一定的“左/右手性”。
这个设计的价值在于:它改变了肩关节旋转中心的位置,从而改变了可达范围。例如,伸手够高的物体时,可以通过肩膀向上顶来增加高度,向前伸手时,可以让肩膀稍微向前探,以增加前伸距离。虽然这种动作幅度很小,但能提升一定的运动灵活性,这就是为什么加这么复杂的结构。
腰部
Scott:这是腰部。从关节联动来看,我判断这里是一个五自由度腰部,关节拓扑大致为 ZY + XYZ 组合。

Scott:从骨盆区域往上看,这里是一个Z 轴旋转关节,与之前的机器人相似,几乎所有人形机器人也都采用这种设计。如果腰部只保留一个转动轴,通常会选这个轴。

Scott:Y 轴在下方(绿色),蓝色区域是另一个自由度。

Scott:这就是我担心的地方。侧面的线性执行器通过一根拉杆连接到上方的球形关节,也就是 杆端球铰(Heim joint),但这个关节在画面里呈偏斜、扭转的姿态,说明拉杆并没有与关节轴向对齐。此时,真正阻止它继续扭转的,只有末端那颗螺母:如果再继续扭转,旁边这个“环”的侧面就会撞上螺母,形成唯一的机械限位。
在这种配置下,杆端球铰 相当于用一个三自由度关节去解决本来只需要两自由度的问题,无法真正限制沿拉杆方向的扭转。这会带来两个直接风险:一是更容易和周围结构发生干涉或磕碰;二是扭转和磕碰可能导致控制拉杆产生微小的额外伸长量。

Scott:从这里我们基本可以确定:这一段就是 Y 轴。在这个结构里我看不到任何清晰的 Z 轴,但它肯定是藏在里面某个地方的。然后我们再回到这张图,就可以更明确地标出来:这里是绕 Y 轴转动的位置。

Scott:你还能看到,我把上面的两根线性执行器单独高亮了出来。往下看,在这些转动点上——不论是下面的固定端,还是上面跟随转动的那一端——都必须使用 杆端球铰 来提供所需要的旋转自由度,用来驱动这颗“头”。
膝关节

Scott:接着是膝关节。左边是原版 Iron,使用改进型Herkin 机构驱动膝关节,其中有一个四杆机构。这个设计的目的是平滑关节的力矩曲线,让膝关节在活动范围内保持恒定的输出力矩,而不是那种波动大的曲线。这样可以在大幅度屈膝时维持较为平稳的动作。
然而,这样的设计有副作用:在某些极端姿态下,这套机构会“蹦”得非常高,尤其是机器人下蹲时,机构会从膝盖后部凸出来。这种设计在直立姿态下是“收”回去的,不容易察觉,但在大幅度屈膝时则显得非常突出,视觉效果不自然。
其他厂商的常规做法是将膝关节的驱动放在大腿前侧的股四头肌位置,模拟人类膝关节的自然运动。而这次的设计改了位置:将执行器从膝盖上方移到了膝盖下方,改变了Herkin 机构的布局,使其从膝盖后面凸出。
此外,他们还废除了旧版的 RAF / R-AF 机构,改为新设计,将髋关节的外展动作由后部的电机负责,并引入新的旋转关节结构。这种变化对膝关节的动作自由度和外观都有显著改善。

Scott:你可以看到,他们将执行器移到这个位置后,虽然仍然有些凸出,但相比之前没有那么夸张,位置的变化使得外观上出现了一个小小的“鼓包”。当我看到这个效果时,我的第一反应是:“哇,这家伙连膝盖骨都做出来了!”看上去非常人类化,简直像一对真人的膝盖。
从侧面看,还能看到部分踝关节机构,这块区域同样有些凸出。我们可以通过这些外部的鼓包和轮廓推断出:里面确实是机械机构,而不是隐藏了一个人。

Scott:从背后视角可以更清楚看到髋关节区域的大致布置:这里这条是一路向下延伸的膝关节执行器;上方这一块能看到一部分外展执行器;负责轴向旋转的机构布置在更靠外侧的位置,在这个视角下不太容易看清,旋转动作在那一侧完成。

Scott:要走“猫步”(catwalk)必须保留这个外展自由度,只有这样,一只脚才能真正跨到另一只脚前面。如果把外展自由度拿掉,双脚就只能笔直往前走,无法交叉,因为腿之间的夹角不能改变。
看最初那版 Iron,可以看到小腿“肌肉”非常大;在新版里,小腿做得小了很多。原因是他们在里面塞了很多填充物,用这些“肉”去塑造接近人类的小腿形状。机构本身还是会顶出来,只是被填充物遮住了;如果下面还是原来的那套机构,鼓包会更明显。所以现在把执行器做得更小,以配合外观。
髋关节
这里是髋关节,一个 ARF 结构设计(A–R–F),和 Optimus 上的关节顺序基本一致。屈曲(flexion)自由度布置在这里,通过这一段实现髋关节的屈伸运动,而且位置保持得比较靠上。

Scott:这次他们还是把屈曲自由度布在这里,也就是把屈曲轴放得比较高。这个结构本质上还是一个反向四连杆机构,和膝关节那里用的是同一套设计。你可以看到这根红色的执行器,它沿着这条连杆方向产生位移。上面这一整串就是连杆机构,往上延伸,在不同位置设置了很多转动铰点(我在图里都做了标注),共同作用的结果,就是围绕这里的 F 轴 产生转动——所以屈曲自由度就是通过这条 F 轴来实现的。
这边这一组机构,是用来把整条输出力矩曲线尽量拉平的,让扭矩随关节角度变化更加平顺、好控制,不过代价是机构会复杂一点,多一些零件。
不过,当我真正数了一下整机里所有这些地方时,会发现它们现在全身一共用了将近三打(约 36 个) 杆端球铰 。也就是说,它们在很多部位还是大量上了这种球铰——显然,它们并不“惧怕”这种结构,说明在工程上已经摸索出足够多的经验,觉得可以放心大胆地用。

Scott:以上就是这一部分机构的整体概览。手部方面,他们正在升级新手,但目前公开素材里的信息还不多,我本人也还没近距离看过那只新手。
Electrek 的 Fred Lambert 受邀到现场,拍了一段展示新手实物的视频,不过画面里看不到手的运动。因此,从目前能看到的情况来看,那只新手大概率仍处于原型机阶段。不过他们现在的配置,是把旧款的那只手装在新版本的机体上。
“仿生肌肉”

Scott:他们这次称其为仿生肌肉(bionic muscles),但我更倾向于称其为筋膜(fascia)。筋膜是连接肌肉和器官的组织,在人体运动中贡献大约10%的能量。
这层仿生筋膜能实现几个功能:平滑动作,分散高频振动和异响;减振/降噪,让动作更加柔和;塑造外形,帮助形成体型轮廓;散热,通过空腔和孔洞促进空气流动。
然而,筋膜不仅是“包一层”,更像是一个跨越身体的力传递网络,有助于协调动作,例如走路时,左手与右脚同步摆动,这与筋膜的结构密切相关。

Scott:汽车行业里也用“fascia”这个词,指前保险杠那块装饰件,只负责“好看”;而这里我说的 fascia,是指皮肤和肌肉之间那一整层组织。Iron 这次用的“仿生肌肉”,从目前公开图看,其实更像一层 填充/垫层:主要作用是“堆体积、塑形”,把臀部、小腿、髋部这些部位撑到更接近人类比例,再在外面套“衣服”。1X 也在做类似事情:在结构外侧加一层 3D 打印格构填充,既吸能、缓冲冲击,又帮忙塑造体型、消除夹缝和夹点,兼顾安全与观感。
我更感兴趣的是,这类“仿生筋膜 / 填充层”未来可以被功能化。比如,在特定区域做成定向柔顺、各向异性柔顺,用结构本身去分散载荷、避免局部高应力;在某些方向上,让关节运动更省力、更顺滑。同时,它们完全可以被当作配重/平衡块来设计:像电梯的配重、工业机械臂后面的配重块那样,在机器人伸手或大步迈步时,帮电机分担一部分冲击和惯性,而不是让执行器硬扛全部负载;在关节试图做极快、极猛动作时,这一层结构还能像一件有弹性的紧身衣,既限制极端动作,又在关键部位提供支撑。
我完全不惊讶未来会有人把这些“筋膜结构”直接做到机器人外衣里:像运动员穿的那种带有筋膜走向 / 受力导向的功能服,通过织带和张力,固定“肌肉”位置、辅助发力。哪怕现在看上去它们还是“人工覆盖物”,它们完全有可能从“美化 + 保护”,进化成性能必需件,变成让机器人达到目标性能的关键一环。
从整体设计上看,Iron 这一代在肩胛骨、腰椎/“脊柱”、额外自由度上的尝试是很有看点的:做了肩胛机制、大自由度“脊柱/腰”,从腰部 RSU 旋转结构退回到线性执行器方案,再叠加这层更复杂的“仿生筋膜 / 外覆结构”,都属于值得立“路标”的变化,说明团队确实在用实测数据做迭代,而不是只在 PPT 里画概念图。
现实落地上,他们自己承认:把机器人丢进工厂做拧螺丝这种简单工序,不到一个月就顶不住,尤其是这代非腱驱手,对电动工具振动非常敏感;同时他们也认为现在的版本还达不到进家庭的门槛。于是得出的结论是:工厂环境太“毒手”,家庭环境门槛又太高,当前阶段就先把机器人放在展厅里当销售,用来卖车。风险控制角度这没问题,但从学习可迁移技能、获取高价值数据的角度,这类“前台 + 销售”场景能沉淀多少对未来“家庭场景”真正有用的经验,是打问号的。
谈到可靠性,可以类比到 1X:单个电机标称寿命约 10,000 小时,但一台有约 30 个电机 的整机,第一次出故障的期望时间只有几百小时(几周级别)。如果经常在 3 倍额定负载 下做极限发力,寿命大约只有 10 万次循环;始终工作在额定范围内,则可达到约 200 万次循环,相差一个数量级。这本质上就是材料疲劳/腱驱老化:越频繁逼近极限,退化越快。
像 Clone Robotics 这种全气动肌肉路线,在工程上也会面临类似甚至更极端的挑战:多自由度耦合严重、行为需要 AI 辅助“解耦”;就算耐久性问题解决了,压缩机、气罐、控制阀如何塞进躯干,以及整天“嘶嘶”放气、进气带来的噪音,也都是现实问题。
从行业格局上看,小鹏 CEO 在台上说“这是第一家做到这个程度的中国公司”,某种程度上反映了中美在人形机器人上的“心智战 / 军备竞赛”情绪。就“外观与拟人度”而言,Iron 已经做到足以让人短时间误判为真人,在这点上他们率先交了一次作业,也踩中了 Tesla 自己公开过的目标。更长远来看,他们在固态电池上也做了有意思的选择:认为车用固态电池暂时难以经济大规模部署,而机器人能耗小得多,可以先在机器人平台上试水,把它当成固态电池的落地“前哨阵地”。
综合这些因素,我会把这家公司列入必须长期追踪的玩家名单:一方面,他们在自由度配置、躯干结构、仿生外覆层和电池路线上的尝试都足够“新”;另一方面,当前在“能否长期稳定做有用工作、ROI 是否成立”这两个维度上,还存在明显缺口——这正是后续最值得盯的地方。