近日,头部机器人相继发布新进展。
特斯拉在社交媒体发布一段做家务视频。展示了倒垃圾、用铲子搅拌锅、操作吸尘器、把物品放在置物架上、打开柜门、拉窗帘等一系列简单家务能力。
Figure机器人则展示了一段工厂视频,称在宝马X3生产线完成连续20小时轮班作业。并表示已经持续数周进行10小时轮班作业。
值得一提的是,特斯拉在视频中称,其所有机器人使用同一个神经网络模型训练。而且,这些家务技能皆由真人视频学习而来,而非现在常用的VR动作捕捉学习。
“特斯拉应该不是只看视频就学会,因为产业中通常采用真机数据采集、仿真环境合成数据,进行具身智能模型训练。因为视频是二维的,需要算法精准还原成三维、高精度比较难,而且视频缺乏物理属性,比如机器人真正操作物体的时候,零件的重量、材质、内部结构等都是需要判断的。”快思慢想研究院院长田丰对21世纪经济报道记者表示。
头部机器人进展迅速
机器人正在成为一、二级市场的投资主线,相关商业动作不断,持续催化。
据记者不完全统计,仅5月以来,就有具身智能公司自变量机器人完成数亿元A轮融资,由美团战投领投、美团龙珠跟投;华为与优必选正式签署全面合作协议,围绕具身智能和人形机器人领域合作;腾讯云和越疆科技开启深化战略合作,加速具身智能机器人规模化落地。
而前述海外头部公司进展更快,也成为国内机构极为关注的率先量产标的。
“这两家公司(特斯拉、Figure)非常关注机器人大脑,重视空间智能的研发。”田丰表示。
在田丰看来,特斯拉有自动驾驶的积累,可以往机器人模型做迁移。自动驾驶方面,很多厂商还是用分段式的架构去处理,比如车辆的感知、规控、执行等模型。机器人比FSD(完全自动驾驶)还要复杂一些,“按马斯克的说法,自动驾驶是在二维空间的自主移动,机器人是三维空间的自主行动,决策判断要更复杂。”
机器人如何实现三维空间中的复杂操作?特斯拉、Figure等头部厂商现在是采用端到端的方案,不过因为采用一个模型,涉及全身关节的数据,在实践中非常难以获得大规模、高质量训练数据集。
田丰坦言,“我们还不知道控制擎天柱的电脑实际操作情况,特斯拉并没有透露控制程度可以做到多少无人化或少人化,但至少从视频上看,端到端的模型还是做得很好。”
实际上,对大模型来说,一直存在Scaling Law(缩放定律)的实践真理,通过指数级放大数据量、模型参数量和算力,可以快速逼近AGI,但就具身智能来说,阻碍机器人产业Scaling Law的关键瓶颈,在于数据规模。
田丰表示,“因此大家有一个普遍看法,认为物理世界的真机数据是非常宝贵的,采集成本非常高,而且需要很多时间才能起量规模化。特斯拉透露过,合成数据在其训练里占了不小的比例。现在产业里通常都是往仿真环境去迭代。因为仿真环境可以带入更多物理属性的数据,大部分玩家还是在英伟达的Omniverse Isaac平台做仿真学习,中国也有一些平台,比如松应科技、群核智能等。”
速度、精度难题尚需克服
人形机器人进工厂“打工”,成为产业较为一致的从实验室走向商业化的关键场景。
公开资料显示,美的自研的“美罗1号”人形机器人已正式前往美的洗衣机荆州工厂“打工”;乐聚机器人公司于今年1月完成了100台人形机器人的产业化交付;小鹏官宣其AI机器人Iron将于2026年规模化进入工业化量产,目前已在广州工厂实现Iron实训落地。
不过,田丰认为,目前人形机器人还没有办法替代人,还存在速度和精度的问题。其中速度跟电机、减速器等有关,比如能不能支持身体手臂的快速移动;精度则和传感器有关,需要力反馈,也跟工厂环境有关,比如可能有磁性。而且工厂要求非常快的生产节拍,现在机器人干活比较慢,还不能完全跟上自动化生产线节拍。
“我认为对工厂环境来说,人形机器人的交付量是一个关键的里程碑。一旦有单个工厂或企业用了1000台,说明这件事已经做到了。现在中国工厂里打工的机器人成本还很贵,单台价格可能就要50—80万元,甚至100万元。”田丰判断。
找到高价值产业场景、快速适配迭代、解决生产力瓶颈、起量规模化,是加速人形机器人落地的必经之路,而拥有制造环境的厂商有先发优势。
这或许也是赛力斯、长安汽车、奇瑞汽车等一众整车厂,美的、海尔、追觅等消费制造企业纷纷入局机器人的动因。
田丰表示,“其实机器人自身的装配也可能会成为机器人训练的天然场景,就是机器人自己来组装自己,一旦可以满足自己的需求,也是非常大的工业级市场。”
比如,Figure此前就发布人形机器人制造工厂BotQ,年产能可达12000台人形机器人,并计划在四年内将产能提升到年产10万台机器人。
国泰君安证券也认为,将自研人形机器人投入到自身的生产流程中,既大幅提升自动化水平,降低人力成本,又通过真实场景积累训练数据,测试产品性能,形成“研发—制造—反馈”的闭环迭代。相比于传统的汽车生产线,有望逐步实现“人机混合生产—全机器人生产”的渐进路径。
更多内容请下载21财经APP