AI驱动具身机械人进入量产年代|林小珍
发布时间:15:00 2026-05-14 HKT
年初的OpenClaw热潮,一度令不少从事文书工作的人士担心饭碗不保。在电子的世界,OpenClaw这类AI代理,确实有条件取谛不少劳动力﹐但回到实体世界,光有AI并不足够,结合AI的机械人,将会是大势所趋。
机械人既能跳舞又能写大字
笔者跟许多朋友一样,对于机械人在现实环境的运作,一直都有种「似是而非」的感觉,既知道机械人技术的发展一日千里,可以灵巧地进行许多动作,但对于机械人是否可以应付复杂多变的现实世界,仍然半信半疑。今个星期初笔者获邀参与首届香港具身智能产业峰会暨2026智元合作伙伴大会,总算有机会亲身体验一下,目前具量产条件的机械人的真正实力,以及背后的技术发展。
先分享一下当日活动所见,活动以一场机械人跳舞表演揭开序幕,不少高难度的动作都能够准确完成。之后出场的更加惊喜,机械人竟然可以表演传统舞狮,不少嘉宾都叹为观止。之后我们更有机会与机械人近距离互动,例如是请机械人为我盛载爆谷、请它为我插手机充电线充电,甚至为我即席挥毫写挥春。当中不少机械人都具备话音功能,广东话对答亦无难度。


成立三年 智元市占逾三成
会场中见到的机械人,都是由智元创新所生产的智元AGIBOT。这家2023年才成立的公司,截至今年三月,已经量产了一万部机械人,是国内的机械人龙头企业。根据市场研究机构 TrendForce上个月发表的报告,预期今年中国的人型机械人年产量将会增长94%,当中宇树科技和智元就占近八成。当中,宇树占比近五成,智元占比超过三成,而排名第三的是在港上市的优必选(9880),但市占率只有8%。智元预计今年将会量产超过一万台机械人。
人型机械人的性能涉及多项因素,智元的创始人、董事长兼首席执行官邓泰华,以及联合创始人兼首席技术官彭志辉,在会上提供了一个令外行人都易于理解的框架——「一体三智」。一体是指机械人的硬体,物理上可以做到甚么动作,而三智则是运动智能、交互智能和作业智能。
「一体三智」环环紧扣 缺一不可
运动智能是指机械人的全身控制和平衡,如何在不同环境都不易跘倒,而且要及时反应,追求毫秒级启停响应;交互智能是指多模态感知与对话,即是类似我们日常跟Chat GPT和Gemini对话,系统能理解及作出适当回应,追求多模态融合与语义泛化;而作业智能则是要机械人可以执行复杂的长程任务,即是知道要做甚么之后,要如何用机械人的躯体去做到,追求高维空间中的长序列推演。要「一体三智」全面做好,组成「感知-决策-执行」的完整价值循环,机械人才能发挥作用。
逻辑不难理解,但试想像一个人要拾起一只杯和一只鸡蛋,我们会很自然知道两者形状和材质不同,要用不同的手法和力度,如果用拿杯的力度拾鸡蛋,很容易弄破鸡蛋。要机械人做到同样的操作,既要它理解和分析环境和物件特质,用适当的力度和手法,再要机械臂有能力执行,是很高的技术要求。
具身机械人已进驻工厂
以智元的机械人为例,已经可以应用于多个真实商业场景,包括工业制造,例如是分拣材料、搬运;地铁导览以及零售门店。内地有汽车零部件企业采用了近百台智元AGIBOT运作,处理金属件搬箱动作,亦有电子代工厂用机械人与人类工人合作的模式,进行平板电脑的抓取和测试。
由以上的例子可以见到,机械人已经可以处理到许多在指定环境,有特定规律的工作,有效解决劳动力不足,或者要人手进行低增值工序的成本问题。当然,目前的机械人技术,仍然是以针对特定环境的指定操作为主。要好像人类一样,可以用同一个躯体,在不同的环境做到各种要求灵活度的工作,相信仍有技术问题有待科技界克服。.
林小珍

















