你会花2000元拼搭一个会动的乐高汽车,那么你会花10万元组装一个属于自己的人形机器人吗?

百度智能云与智元机器人今天在沪签署战略合作协议,双方将围绕具身生态解决方案建设、关键技术和产品研发及生态协同展开深度合作。这意味着,未来用户不仅可以组装身高1.3米的人形机器人,还可通过百度云的100多种场景和多模态大模型,二次开发有一技之长的机器人了。
两个专业人士两天可组装一个机器人
身高1.3米,体重33千克,续航2小时,最快行走速度1m/s,组装一个有模有样的人形机器人,难度高吗?
带着这个问题,记者来到智元机器人的“人人造”工厂,这里有多个团队正在组装“灵犀X1”人形机器人,这也是全球首款全栈开源机器人。记者看到,拆箱后,所有的零件可以密密麻麻铺满工作台。现场工作人员介绍,一个通用人形套餐包含自适应夹爪OmniPicker、域控制器DCU、PowerFlow系列电机等核心组件以及结构件、电子件等。“基于模块化设计,用户可以自由组合骨架、驱动系统、传感器,一般来说,两个专业人士两天可以组装完成一个机器人,通过预置程序,组装完的机器人可以完成招手、行走等简单动作。”他说。

相比乐高,机器人的组装难度是专业级的,更适合发烧友和相关从业者。柳州职业技术大学副教授关来德带领教研团队正在“攻关”,一个手肘就需要看着图纸琢磨好一段时间。“我们准备未来引入到课程中。”关来德告诉记者,对于机器人应用专业的学生来说,有着“一站式”开源软硬件全套图纸和代码的机器人,可极大加速全球机器人技术的普及。

用大模型二次开发人形机器人
花两天时间组装完的灵犀机器人,是一个有手有脚但不善于思考的“人”,要让他聊天、跑跳、端水或做更加高级的事,还需要进行二次开发。
智元机器人与百度智能云的合作,就相当于为人形机器人装上“眼睛”和“大小脑”。百度智能云一见产品部解决方案负责人呼啸告诉记者,根据合作,百度智能云将提供不少于100个视觉场景模型,极大地扩充具身智能在视觉理解方面的能力。“过去机器人都是靠指令来完成操作,未来接入大语言模型等多模态大模型后,机器人就有了手眼协调、能说会道的能力。”他表示,这种软硬件结合的开源生态,有助于创业者在教育科研、安全生产、连锁合规、工厂SOP、农业等场景下进行拓展开发,赋能千行百业。
记者获悉,目前百度智能云已接入DeepSeek R1和V3模型,这意味着,开发者可以用更低的成本将大模型与机器人结合,帮助人形机器人加速进化。
据悉,战略合作的首期落地阶段,百度智能云与智元机器人将聚焦教育市场,共同打造可二次开发的人形机器人平台。基于共建方案,相关专业师生可在AI实训实验室中通过平台内置的行业模型库和算法产线,自主训练机器人完成物品分拣、环境巡检等高精度任务模型,为教育科研机构开展人形机器人DIY开发,加速产学研生态构建与成果转化。

向上拔尖,向下普及
2024年被誉为“具身智能的觉醒之年”。过去一年,AI大模型与人形机器人的深度耦合,推动具身智能迈向全球科技竞争的新高地。据高工产业研究院(GGII)预测,2030年全球人形机器人市场规模将突破200亿美元,中国市场占比达四分之一。
不少专业人士判断,今年将是人形机器人与多模态大模型“交互”的一年。复旦大学计算机学院教授、MOSS大模型项目负责人邱锡鹏就判断认为,目前的机器人只能做一些跳跃、抓取等动作,未来可以让机器人与软件进行交互,以更好识别人类的意图:“大模型与人形机器人的结合有很大的想象空间。”
这也是智元机器人的判断。上海智元机器人销售总监刘强介绍,企业做的是“本体+AI”全栈技术,目前只有三分之一的技术人员投入本体开发,还有三分之二的技术人员投入“大小脑”以及AI算法模型的开发,下个月就会发布具身操作大模型。在他看来,具身智能技术的发展可分为五个阶段,即G1至G5,目前整个行业的具身智能技术还处于G1到G2的阶段,即机器人能够基于大语言模型进行任务编排,部分前沿企业已到了G3阶段,即能够灵活适应不同场景和任务,而要达到G5阶段的通用人工智能终极形态,可能还需要10年。
除了向上拔尖,当下人形机器人还要做的是“向下普及”。马斯克今年1月曾表示,特斯拉计划在今年生产数千台套人形机器人Optimus,明年产量或将达5万至10万台。智元机器人目前在临港新片区已建立机器人制造工厂,今年1月初公司通用具身机器人累计下线达1000台。刘强表示,目前“灵犀”机器人的售价在10万左右,随着人形机器人进入DIY时代以及开源生态的崛起,规模化量产将大大降低机器人的成本,或许两三年后,就可以花5万元“组装”一台能做家务的人形机器人了。
(文章来源:上观新闻)
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12