<汇港通讯> 上海机械人初创公司智元机械人正式发布智元启元大模型GenieOperator-1(GO-1),这是中国首个通用具身基座模型。
智元称,这款模型具有泛化能力,能够在极少数据甚至零样本下泛化到新场景、新任务,降低具身模型的使用门槛,降低後训练成本。
据介绍,该模型开创性地提出Vision-Language-Latent-Action(ViLLA)架构,实现可以利用人类视频学习,完成小样本快速泛化。ViLLA架构是由VLM(多模态大模型)+MoE(混合专家)组成,其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类运算元据获得通用的动作理解能力,MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力。在推理时,VLM、Latent Planner和Action Expert三者协同工作。目前智元启元大模型已成功部署到智元多款机械人本体。 (JJ)
新闻来源 (不包括新闻图片): 汇港资讯