智元发布首个通用具身基座大模型GO-1
据“智元机器人”微信公众号3月10日消息,智元发布首个通用具身基座模型——智元启元大模型(Genie Operator-1)。
据介绍,智元提出了Vision-Language-Latent-Action(ViLLA)架构。该架构由VLM(多模态大模型)+MoE(混合专家)组成。其中,VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力,MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力——三者环环相扣,实现可利用人类视频学习,完成小样本快速泛化,降低了具身智能门槛,并成功部署到智元多款机器人本体。
资料显示,智元机器人为华为前“天才少年”彭志辉参与的创业项目,彭志辉是其联合创始人。彭志辉于2018年研究生毕业于电子科技大学信息与通信工程学院;毕业后就职于OPPO研究院AI实验室担任算法工程师;2020年,通过华为“天才少年”招聘计划入职华为,2022年12月从华为离职开始创业。2023年2月,彭志辉联合创立智元机器人。
(文章来源:中国证券报·中证金牛座)