转载

OpenAI研究 用于机器人抓取的域随机化和生成模型

由于算法的改进和数据可用性的提高,基于深度学习的机器人抓取取得了重大进展。然而,最先进的模型通常只在数百或数千个独特的对象实例上进行训练,因此泛化可能是一个挑战。

在这项工作中,我们探索了一种新的数据生成管道,用于训练深度神经网络执行抓取规划,将域随机化的思想应用于对象合成。我们生成了数百万个独特的、不切实际的程序生成对象,并训练了一个深度神经网络来对这些对象进行抓取规划。
由于给定对象的成功抓取分布可以是高度多模态的,我们提出了一种自回归抓取规划模型,该模型将场景的传感器输入映射到可能抓取的概率分布。该模型使我们能够在测试时有效地对掌握进行采样(或完全避免采样)。

我们在模拟和现实世界中评估我们的模型架构和数据生成管道。我们发现,尽管只接受了随机对象的训练,但在模拟测试时,我们可以在以前看不见的现实对象上实现 >90% 的成功率。尽管只接受过随机模拟物体的训练,但我们还在现实世界的抓握尝试中展示了 80% 的成功率。

详细论文