转载

OpenAI研究 刀塔 2

创建了一个机器人,它可以在标准锦标赛规则下的 Dota 2 1v1 比赛中击败世界顶级职业选手。机器人通过自我对弈从头开始学习游戏,不使用模仿学习或树搜索。这是朝着构建人工智能系统迈出的一步,这些系统可以在涉及真实人类的混乱、复杂的情况下完成明确定义的目标。

今天我们在国际邀请赛 的主舞台上 对阵 Dendi,赢得了三场两胜制的比赛。在过去的一周里,我们的机器人在与包括SumaiL  (世界顶级 1v1 玩家)和 Arteezy  (世界顶级综合玩家)在内的许多顶级职业选手中保持不败 。

Dota 1v1 是一款包含隐藏信息的复杂游戏。代理人必须学会计划、攻击、欺骗和欺骗他们的对手。玩家技能和每分钟动作之间的相关性并不强,事实上,我们的 AI 的每分钟动作与普通人类玩家相当。

学习机器人行为海报

在 Dota 中取得成功需要玩家培养对对手的直觉并据此制定计划。在上面的视频中,您可以看到我们的机器人已经完全通过自我对弈学会了预测其他玩家的移动位置,即兴应对不熟悉的情况,以及如何影响其他玩家的盟军单位以帮助它取得成功。

整场 Dota 比赛由两支五人队伍进行。每个玩家从一百个英雄和数百个项目中进行选择。我们的下一步是创建一个 Dota 2 机器人团队,可以与顶级人类团队竞争和协作。如果您想从事项目的下一阶段,请考虑 加入 OpenAI