OpenAI研究 复古大赛
我们正在发起一项迁移学习竞赛,以衡量强化学习算法从以往经验中概括的能力。
为什么重要
在典型的 RL 研究中,算法在与训练相同的环境中进行测试,这有利于记忆力强且具有许多超参数的算法。相反,我们的比赛在以前看不见的视频游戏关卡上测试了一种算法。本次大赛采用Gym Retro这一将经典游戏融入Gym的全新平台,首发30款SEGA Genesis游戏。
我们正在发起一项迁移学习竞赛,以衡量强化学习算法从以往经验中概括的能力。
在典型的 RL 研究中,算法在与训练相同的环境中进行测试,这有利于记忆力强且具有许多超参数的算法。相反,我们的比赛在以前看不见的视频游戏关卡上测试了一种算法。本次大赛采用Gym Retro这一将经典游戏融入Gym的全新平台,首发30款SEGA Genesis游戏。