generals ai进度汇报

众所周知，自从初代棋类ai alphago 到 alphazero 再到 muzero，都用到了蒙特卡洛树搜索算法，我自然也想用。但是众所周知，alpha系列算法只能解决对称信息零和博弈，而generals属于非对称信息零和博弈（1v1模式）。我本来的想法是在mcts扩展步骤的时候用人类下棋数据监督学习一个对手棋形预测器，希望这个预测器能够按概率预测对手棋形。举个例子，经过计算，在已有信息下，对手棋形为a形的概率为1%，那这个预测器就有1%的概率输出a。但是经过我的仔细思考，~~以及小学四年级以前的围棋训练和五段水平~~，我认为不需要这么麻烦，而且仔细一听就知道这个模型收敛要过很久很久。因为我认为，generals具有以下特点：

相对于围棋，generals更为连续，甚至我认为可以把generals棋形近似成波。
相对于围棋，generals可选操作更多，但是多数操作的效果都是一样的，不像围棋，差一格导致的差别就十万八千里。

所以我认为可以不使用alpha系列算法的模式，我认为应该降低我要写的东西的计算深度和广度，并且可以考虑不使用mcts。对了，mcts没啥神奇的，用途和原理类似于启发式搜索+模拟退火+随机化贪心。

generals ai进度汇报

讨论操作

回复

相关推荐

generals ai进度汇报