1月9日,《每日经济新闻》记者从具身智能机器人公司银河通用处了解到,该公司联合北京智源人工智能研究院及北京大学和香港大学研究人员,发布了全球首个端到端具身抓取基础大模型GraspVLA。
据介绍,该模型的预训练完全基于合成大数据,训练数据达到了有史以来最大的数据体量,即十亿帧“视觉-语言-动作”对。
在模型效果上,预训练后,模型可直接Sim2Real(从模拟到现实)在未见过的、千变万化的真实场景和物体上零样本测试,在全球范围内首次展现了光照泛化、干扰物泛化和背景泛化等七大泛化能力;针对特别需求,后训练仅需小样本学习即可迁移基础能力到特定场景,在维持高泛化性的同时形成符合产品需求的专业技能。
然而,银河通用近期的“高光时刻”不止于此。
在最近备受科技圈关注的“科技春晚”CES 2025(2025年国际消费类电子产品展览会)上,银河通用具身大模型机器人Galbot作为全场唯一的轮式人形机器人在英伟达创始人兼首席执行官黄仁勋的演讲中登场,用机械臂举起了基于Blackwell架构的新一代RTX 50系列显卡。而下一代的主力芯片由人形机器人高高举行,也被认为是英伟达作为芯片巨头对未来人形机器人万亿产业的期待。
2024年掀起的人工智能热潮延续至今,具身智能势必是本届CES的看点之一。银河通用、宇树科技和星动纪元等多家中国具身智能的“明星”公司参展,在各展区展示了机器人在日常生活、工作和医疗等多个场景的应用。
过去一年中该领域投融资事件频发,资本的看好也足以证明具身智能赛道的前景之广阔。IT桔子数据显示,截至12月5日,我国具身智能领域共发生投融资事件38起,投资金额共计51.1亿元,远超2023年全年的16起。
天眼查显示,银河通用在2024年11月完成了5亿元战略轮融资;同年6月其完成了7亿元天使轮融资,投资方背景多元,包括美团战投、北汽产投、商汤国香基金、讯飞基金等战略及产业投资方;启明创投、蓝驰创投、经纬创投、源码资本、IDG资本等头部财务机构,光源资本担任融资财务顾问并参与早期投资。
在发布了GraspVLA后,银河通用表示,公司将快速推出覆盖多技能的具身基础大模型,全面整合团队从抓到放、从关节类物体到柔性物体操作的各类任务的合成数据,持续依靠合成大数据作为唯一预训练来源,释放前所未有的潜力与能力,定义具身智能的ChatGPT时刻,推动人形机器人出现下一个高峰。