自DeepMind的“阿尔法狗”击败围棋大师李世石以来,“即时战略游戏”便成为了人工智能专家们竞相追逐的新目标。DeepMind更是宣布将为研究人员提供一项利用《星际争霸Ⅱ》来测试人工智能新算法的方案,而阿里巴巴也早已开发出了针对《星际争霸》的增强学习框架。这一系列动作无疑将人工智能与即时战略游戏推向了前所未有的高度。
然而,在众人热议人工智能挑战“即时战略游戏”之际,却鲜有人关注到其在军事领域的深远影响。实际上,众多“即时战略游戏”本身就是一款军事作战指挥模拟软件。例如,那些以二战为背景的游戏,玩家得以扮演各国将领,亲身感受各军兵种在战争中的独特作用,仿佛穿越时空,亲历那些经典战役。此外,一些策略性极强的游戏,更注重整体战略与局部战术的运用,玩家可以如同沙盘推演一般,指挥调配自己的军事力量,运用各种战略战术攻击对手。尽管战斗过程被简化,但其对实战分析的模拟程度却相当高,从而为提升军事指挥训练水平提供了极大帮助。
战争是残酷的生死较量,一款真正的军事游戏必须具备高度对抗性。实战对抗游戏的乐趣源于旗鼓相当的“对手”,而实力悬殊的“碾压”则会破坏游戏的对抗乐趣。目前,游戏中自带的人工智能还比较原始,基于预编程序的规则,缺乏学习能力,一旦被人类对手找到弱点,便难以再取胜。
另一种原始人工智能的情形是,通过快速从游戏代码中获取信息,对屏幕内外所有单位下达指令,其“手速”远超人类,可以一直“碾压”人类对手。这种情况下,人类与原始人工智能“对战”很快就会失去兴趣,进步也不快。提高水平的最好办法,就是找到一个旗鼓相当的人类对手,但不同的选手之间水平差异较大,很难找到一个水平层次相当的对手,更不用说一直陪伴自己共同提高的“伙伴”了。
当拥有增强学习能力的人工智能开始挑战“即时战略游戏”时,我们看到了解决上述问题的曙光。人工智能通过成千上万次高强度的训练和比赛,不断积累经验,提升自身水平,找到各种复杂局面下的最优方案。相信用不了几年,人工智能就能轻松击败《星际争霸》游戏中的一般选手。随着DeepMind的强势介入,击败顶级选手将指日可待。
之后,人工智能可以进一步拓展至军事指挥训练领域。利用情报系统提供的素材和仿真实验得到的大数据,将各类军事作战想定、规则和参数移植到“即时战略游戏”,建立起逼真的“蓝军”模拟系统。对抗的一方是真实的指挥员,另一方则是人工智能系统。人工智能通过强化学习将自己打造成为指挥员的“私人教练”,成为一个旗鼓相当的对手,并对指挥员开展个性化培训,让其在每局对战中都能发现自己值得改进的地方。随着指挥员水平的不断提升,人工智能还会自动调整自己的水平,让指挥员一直感受到对抗的乐趣和挑战。