转载

OpenAI研究 Gotta Learn Fast：RL 泛化的新基准

在本报告中，我们提出了一种基于 Sonic the Hedgehog™ 视频游戏系列的新强化学习 (RL) 基准。该基准旨在衡量 RL 领域中迁移学习和少样本学习算法的性能。我们还介绍并评估了一些基于新基准的基准算法。