小米开源首代机器人VLA模型 已实现物理智能泛化

更新时间:13:36 2026-02-12 HKT
发布时间:13:36 2026-02-12 HKT

小米今日(12日)宣布开源首代机器人VLA模型「Xiaomi-Robotics-0」。根据介绍,这是一个拥有47亿参数、兼具视觉语言理解与高性能实时执行能力的开源VLA模型,不仅在三大主流的仿真测试中获得优异成绩,更在现实真机任务中实现了物理智能的泛化,即动作连贯、反应灵敏,且能在消费级显卡上实现实时推理。

对于大部分VLA模型在学动作时往往会「变笨」,失去本身的理解能力,小米通过多模态与动作数据的混合训练,让模型在学会操作的同时,依然保持强大的物体检测、视觉问答和逻辑推理能力。

针对推理延迟引发的真机「动作断层」问题,则采用异步推理模式,即让模型推理与机器人运行脱离同步约束、异步执行,从机制上保障动作连贯流畅。