[论文翻译]用AlphaZero评估游戏平衡性:探索国际象棋的替代规则集
Assessing Game Balance with AlphaZero: Exploring Alternative Rule Sets in Chess
用AlphaZero评估游戏平衡性:探索国际象棋的替代规则集
Nenad Tomašev*DeepMind
Nenad Tomašev*DeepMind
Ulrich Paquet* DeepMind
Ulrich Paquet* DeepMind
Demis Hassabis DeepMind
Demis Hassabis DeepMind
Vla...
设计引人入胜且平衡的游戏规则并非易事。现代国际象棋历经数百年演变,但若缺乏历史参照,规则改动对游戏动态的影响难以预测。AlphaZero 为游戏平衡评估提供了基于计算机模拟的替代方案——该系统无需人类监督,仅通过持续自我对弈即可从零开始学习任意规则下的近最优策略。本研究利用 AlphaZero 对国际象棋变体进行创造性探索与设计。由于传统国际象棋存在海量开局理论、职业对局高和棋率,以及相当比例对局在双方仍处于预设准备阶段便已结束等问题,类似菲舍尔随机象棋的变体正受到越来越多关注。我们对比了九种对国际象棋规则进行原子级修改的变体:这些改动在保持游戏接近原版的同时,催生了新颖的战略战术模式。通过 AlphaZero 学习各变体的近最优策略,我们推演出人类高手在这些变体下的对局可能形态。定性分析显示,多个变体极具动态性;分析性对比表明不同变体中棋子价值存在差异,且部分变体比传统象棋更具决定性。这些发现揭示了现代国际象棋规则之外蕴藏的丰富可能性。