12月30日,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目AgiBot World。这一里程碑式的开源项目,标志着具身智能领域“ImageNet时刻”已到来。
几乎涵盖人类日常生活所需的绝大多数场景
据介绍,AgiBot World是全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集。相比Google开源的Open X-Embodiment 数据集,AgiBot World 长程数据规模高出10倍,场景范围覆盖面扩大100倍,数据质量从实验室级上升到工业级标准!在这个具身数据的世界里,机器人不再只是进行简单的桌面任务,而是进入到人类日常生活的方方面面。
AgiBot World数据集中涵盖的场景具备多样化和多元化特点,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等复杂动作,几乎涵盖了人类日常生活所需的绝大多数场景。比如,其中一个视频展示的是机器人在将电脑主机内存条的过程,这需要机器人毫米级精细控制,稍有不慎就可能导致设备损坏,其如神经纤维般灵敏的末端触觉传感器,助力机器人实现了精准的对接;还有试图教会机器人如何用洗碗机的视频——在这条数据中,展现了厨房水池里勺筷碗盘层层堆叠,机器人将杂乱的餐具一一准确无误地整理至洗碗机相应卡槽中,操作流程长且动作十分繁琐。AgiBot World数据集中收录了80多种日常生活中的多样化技能视频,让机器人能够“十八般武艺样样精通”。
复刻了家居、餐饮、工业、商超和办公五大核心场景
AgiBot World数据集诞生于智元自建的大规模数据采集工厂与应用实验基地,空间总面积超过4000平方米,包含3000多种真实物品,一方面为机器人大规模数据训练提供场地,另一方面真实复刻了家居、餐饮、工业、商超和办公五大核心场景,全面覆盖了机器人在生产、生活中的典型应用需求。
家居场景再现人类真实住宅布局,包括卧室、客厅、厨房、卫生间等核心空间,可以实现机器人家务清洁、物品整理和厨房任务等。工业场景模拟分拣与物流自动化,复刻工业仓库与生产线,包括分拣系统、打包设备、传输带等,可以实现物料分拣、包装打包、物流搬运等。通过多场景的高度还原与任务设计,AgiBot World为机器人研发和测试构建了实现具身智能的必要条件。
像这样类似的真实场景AgiBot World百万真机数据集中有100多种,家居占40%、餐饮20%、工业20%、商超10%以及办公场景10%,其中80%的任务均为长程任务,任务时长集中在60s~150s之间,并且包含多个原子技能,长程数据是DROID和OpenX-Embodiment 的10倍以上,3000多种物品基本涵盖了这五大场景,同时还在不断丰富中。
业内人士表示,智元在此刻开源全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集AgiBot World,是具身智能技术发展的重大突破和里程碑事件,更是推进具身智能通用人工智能(AGI)实现的重要加速器。其通过汇聚顶尖资源与技术力量,将共同推动具身智能发展新范式,加速人类迈向通用人工智能的新时代。
未来,智元机器人将陆续开源千万仿真数据,以支持更泛化和更通用的大模型训练;将发布具身基座大模型,可支持模型微调,赋能千行百业;发布全套工具链,实现采集、训练和评测完美闭环。