转载

OpenAI研究 师生课程学习

我们提出了教师-学生课程学习 (TSCL),这是一种自动课程学习框架,学生尝试学习复杂的任务,教师自动从给定的集合中选择子任务供学生训练。我们描述了一系列教师算法,这些算法依赖于学生应该更多地练习那些进步最快的任务的直觉,即学习曲线斜率最高的任务。此外,教师算法还通过选择学生表现越来越差的任务来解决遗忘问题。我们证明 TSCL 在两项任务中匹配或超过精心设计的课程结果:使用 LSTM 加法和在 Minecraft 中导航。

详细论文