转载

2023-04-24
浏览 (47)
评论 (0)

OpenAI研究通过迭代放大学习复杂目标

我们提出了一种称为迭代放大的 AI 安全技术，通过演示如何将任务分解为更简单的子任务，而不是通过提供标记数据或奖励函数，让我们能够指定超出人类规模的复杂行为和目标。尽管这个想法还处于非常早期的阶段，而且我们只完成了简单玩具算法领域的实验，但我们决定以初步状态展示它，因为我们认为它可以证明是一种可扩展的 AI 安全方法。

OpenAI研究

相关文章

Loading...