AI驅動具身機械人進入量產年代|林小珍

更新時間:15:00 2026-05-14 HKT
發佈時間:15:00 2026-05-14 HKT

年初的OpenClaw熱潮,一度令不少從事文書工作的人士擔心飯碗不保。在電子的世界,OpenClaw這類AI代理,確實有條件取諦不少勞動力﹐但回到實體世界,光有AI並不足夠,結合AI的機械人,將會是大勢所趨。

機械人既能跳舞又能寫大字

筆者跟許多朋友一樣,對於機械人在現實環境的運作,一直都有種「似是而非」的感覺,既知道機械人技術的發展一日千里,可以靈巧地進行許多動作,但對於機械人是否可以應付複雜多變的現實世界,仍然半信半疑。今個星期初筆者獲邀參與首屆香港具身智能產業峰會暨2026智元合作夥伴大會,總算有機會親身體驗一下,目前具量產條件的機械人的真正實力,以及背後的技術發展。

先分享一下當日活動所見,活動以一場機械人跳舞表演揭開序幕,不少高難度的動作都能夠準確完成。之後出場的更加驚喜,機械人竟然可以表演傳統舞獅,不少嘉賓都嘆為觀止。之後我們更有機會與機械人近距離互動,例如是請機械人為我盛載爆谷、請它為我插手機充電線充電,甚至為我即席揮毫寫揮春。當中不少機械人都具備話音功能,廣東話對答亦無難度。

會場所見的智元AGIBOT
會場所見的智元AGIBOT
會場所見的智元AGIBOT
會場所見的智元AGIBOT

成立三年 智元市佔逾三成

會場中見到的機械人,都是由智元創新所生產的智元AGIBOT。這家2023年才成立的公司,截至今年三月,已經量產了一萬部機械人,是國內的機械人龍頭企業。根據市場研究機構 TrendForce上個月發表的報告,預期今年中國的人型機械人年產量將會增長94%,當中宇樹科技和智元就佔近八成。當中,宇樹佔比近五成,智元佔比超過三成,而排名第三的是在港上市的優必選(9880),但市佔率只有8%。智元今年目標預計量產數萬台機械人。

人型機械人的性能涉及多項因素,智元的創始人、董事長兼首席執行官鄧泰華,以及聯合創始人兼首席技術官彭志輝,在會上提供了一個令外行人都易於理解的框架——「一體三智」。一體是指機械人的硬體,物理上可以做到甚麼動作,而三智則是運動智能、交互智能和作業智能。

「一體三智」環環緊扣 缺一不可

運動智能是指機械人的全身控制和平衡,如何在不同環境都不易跘倒,而且要及時反應,追求毫秒級啟停響應;交互智能是指多模態感知與對話,即是類似我們日常跟Chat GPT和Gemini對話,系統能理解及作出適當回應,追求多模態融合與語義泛化;而作業智能則是要機械人可以執行複雜的長程任務,即是知道要做甚麼之後,要如何用機械人的軀體去做到,追求高維空間中的長序列推演。要「一體三智」全面做好,組成「感知-決策-執行」的完整價值循環,機械人才能發揮作用。

邏輯不難理解,但試想像一個人要拾起一隻杯和一隻雞蛋,我們會很自然知道兩者形狀和材質不同,要用不同的手法和力度,如果用拿杯的力度拾雞蛋,很容易弄破雞蛋。要機械人做到同樣的操作,既要它理解和分析環境和物件特質,用適當的力度和手法,再要機械臂有能力執行,是很高的技術要求。

具身機械人已進駐工廠

以智元的機械人為例,已經可以應用於多個真實商業場景,包括工業製造,例如是分揀材料、搬運;地鐵導覽以及零售門店。內地有汽車零部件企業採用了近百台智元AGIBOT運作,處理金屬件搬箱動作,亦有電子代工廠用機械人與人類工人合作的模式,進行平板電腦的抓取和測試。

由以上的例子可以見到,機械人已經可以處理到許多在指定環境,有特定規律的工作,有效解決勞動力不足,或者要人手進行低增值工序的成本問題。當然,目前的機械人技術,仍然是以針對特定環境的指定操作為主。要好像人類一樣,可以用同一個軀體,在不同的環境做到各種要求靈活度的工作,相信仍有技術問題有待科技界克服。.

林小珍