目前,一款名为“AlphaStar”的人工智能程序排名进入即时战略游戏《星际争霸II》前0.2%的人类玩家之列。根据近日《自然》发表的一篇论文,这款算法代表了机器学习的一大重要成就,经过改造或有助于解决其它应用领域的复杂问题。
《星际争霸II》是一款科幻主题的策略游戏,有全球性的专业比赛,也是全球最赚钱的专业电子竞技之一。该游戏中有着三种特征和能力截然不同的种族,玩家控制其中一个种族,相互对抗。该游戏已经成为人工智能研究领域的一项巨大挑战;在之前的比赛中,虽然简化了游戏规则,人工编制特定动作序列或依赖超人类的功能(如每分钟执行上万次动作),人工智能体也无法与顶尖人类玩家抗衡。
英国伦敦DeepMind的Oriol Vinyals及同事展现了一款多主体增强学习算法——AlphaStar。在该算法中,若干深度神经网络主体相互竞争,生成大量的持续适应性策略和对策。之后,AlphaStar在一系列在线游戏中与人类玩家比赛,无论玩《星际争霸II》的哪一个种族,AlphaStar都达到了大师级水平。
研究人员表示,这标志着人工智能体首次在没有简化游戏的情况下,在专业电子竞技中达到了顶尖人类玩家的水平。
相关论文信息:https://doi.org/10.1038/s41586-019-1724-z