OpenAI研究 通过迭代放大学习复杂目标
我们提出了一种称为迭代放大的 AI 安全技术,通过演示如何将任务分解为更简单的子任务,而不是通过提供标记数据或奖励函数,让我们能够指定超出人类规模的复杂行为和目标。尽管这个想法还处于非常早期的阶段,而且我们只完成了简单玩具算法领域的实验,但我们决定以初步状态展示它,因为我们认为它可以证明是一种可扩展的 AI 安全方法。
我们提出了一种称为迭代放大的 AI 安全技术,通过演示如何将任务分解为更简单的子任务,而不是通过提供标记数据或奖励函数,让我们能够指定超出人类规模的复杂行为和目标。尽管这个想法还处于非常早期的阶段,而且我们只完成了简单玩具算法领域的实验,但我们决定以初步状态展示它,因为我们认为它可以证明是一种可扩展的 AI 安全方法。