OpenAI研究 2018 年国际邀请赛:结果
OpenAI Five 本周在温哥华的国际邀请赛上输掉了两场与顶级 Dota 2 选手的比赛,在两场比赛的前 20-35 分钟保持获胜的良好机会。
与我们 17 天前的基准相比 ,这些游戏:
- 与明显更好的人类玩家对战
- 使用第三方提供的英雄阵容,而不是 Five 针对人类起草的英雄阵容
- 从大多数专业人士认为的“Real Dota”游戏中移除了我们的最后一个主要限制 。
值得注意的是,这些比赛令人兴奋且势均力敌——相比之下,所有三款 Benchmark 比赛都非常片面——表明尽管 Five 从零开始自学 Dota,但其游戏风格导致了与最好的职业选手相比令人难以置信的游戏玩法。赢球固然好,但输球显示了顶级职业选手的惊人技术,并帮助我们将 Five 的比赛与最好的球员进行比较。
我们非常感谢 Dota 社区中的每一个人,感谢他们帮助为 AI 进步创造了这样一个伟大的训练场:从激励 Valve 创造和发展极其复杂的游戏,到支持可以帮助我们衡量进步的分析师和专业人士,我们从这么多观众那里看到的兴奋让这个项目的工作变得更加有趣。
Five 从 5 月份对低排名玩家的极度限制 Dota 到使用最新限制设置在 Dota 中竞争的进步。
游戏
比赛的目的是展示五人对抗世界上最好的人类的能力,玩“Real Dota”游戏。进入国际邀请赛时,我们不确定到底要和谁比赛,因为这取决于愿意在主舞台上和我们比赛的人的可用性。我们很高兴能与比 Benchmark 强得多的球队交手。
Five 在周三与paiN Gaming进行了第一场比赛 ,paiN Gaming 是世界排名前 18 的 Dota 2 战队之一,并在早些时候的比赛中被国际邀请赛淘汰。PaiN 玩家在职业锦标赛中的平均收入为 350,000 美元。比赛持续了大约 51 分钟(比赛通常持续 45 分钟),在人类开局强劲后,五号在比赛中期收复了一些失地,然后屈服于人类玩家的各种高水平战略推动。星期四,我们与 中国巨星队进行 了第二场比赛 ,其中三人曾一起参加过一支有竞争力的球队。经过一些激动人心的来回团战,Five 在 45 分钟后输了。这些玩家每人的平均锦标赛收入约为 100 万美元。
规则变更

Benchmark 游戏 包含一个非常有影响力的限制,我们现在已将其移除:每个英雄都有自己的无敌信使(一个为您的英雄运送物品的单位),而不是只有一个凡人团队信使。
额外的信使让 Five 发展出其标志性的高压游戏风格,因为信使不断地运送再生物品,让 Five 的英雄不断攻击敌人的基地。在正常的 Dota 游戏中,健康状况不佳的英雄将不得不放弃攻击以进行治疗。许多观察家认为,额外的信使让比赛感觉他们正在观看一场不同于“Real Dota”的比赛。
六天前,我们开始对单个快递员进行培训(快递员本身,就像它的前辈一样,是脚本化的)。虽然我们预计过渡到单一信使会暂时降低 Five 的性能,但社区反馈清楚地表明单一信使游戏玩法会更令人兴奋。
下一步
我们认为快递变更不是造成损失的原因。我们认为我们需要更多的培训、错误修复,并删除我们模型中最后的脚本逻辑。
正如我们在 周三的小组讨论中所说的那样,我们期待着将 Five 推向一个新的高度。这些游戏为 Dota 中的人类 vs AI 游戏设置了新的高水位线,并给了我们很多渴望。但 Five 不仅仅是关于 Dota——它是关于在一个安全的沙盒中构建 AI 技术,这将帮助我们在未来构建先进的系统。