麻省理工学院的研究人员开发了一种机器人训练方法,能够减少时间和成本,同时提高对新任务和环境的适应能力。
这种方法被称为异构预训练变换器(HPT),它将来自多个来源的大量多样化数据整合到一个统一的系统中,有效地创建了一个生成性人工智能模型可以处理的共享语言。这种方法标志着与传统机器人训练的显著不同,后者通常要求工程师为每个机器人和任务在受控环境中收集特定数据。
首席研究员王立瑞(Lirui Wang)是麻省理工学院电气工程与计算机科学的研究生,他认为,虽然许多人将训练数据不足视为机器人技术中的一个关键挑战,但更大的问题在于不同领域、模态和机器人硬件的广泛多样性。他们的工作展示了如何有效地结合和利用所有这些多样化的元素。
研究团队开发了一种架构,统一了各种数据类型,包括相机图像、语言指令和深度图。HPT利用变换器模型,类似于驱动先进语言模型的模型,来处理视觉和本体感知输入。
在实际测试中,该系统表现出显著的结果——在模拟和现实场景中均超越了传统训练方法20%以上。这一改进在机器人遇到与其训练数据显著不同的任务时依然成立。
研究人员为预训练组建了一个令人印象深刻的数据集,包含52个数据集,涵盖四个类别,超过200,000条机器人轨迹。这种方法使机器人能够从丰富的经验中学习,包括人类演示和模拟。
该系统的一个关键创新在于其对本体感知(机器人对自身位置和运动的意识)的处理。团队设计的架构同等重视本体感知和视觉,从而实现更复杂的灵巧动作。
展望未来,团队旨在增强HPT处理未标记数据的能力,类似于先进语言模型。他们的最终愿景是创建一个通用的机器人大脑,可以下载并用于任何机器人,而无需额外的训练。
尽管承认他们仍处于早期阶段,团队仍然乐观地认为,规模化可能会导致机器人政策的突破性发展,类似于大型语言模型所见的进展。
您可以在此处找到研究人员的论文副本(PDF)
(照片由Possessed Photography提供)
想了解更多来自行业领袖的AI和大数据信息吗? 请查看AI & 大数据博览会,该活动将在阿姆斯特丹、加利福尼亚和伦敦举行。该综合活动与其他领先活动共同举办,包括智能自动化会议、区块链博览会、数字转型周和网络安全与云博览会。
探索由TechForge提供的其他即将举行的企业技术活动和网络研讨会这里。