社区讨论

generals ai进度汇报

学术版参与者 6已保存回复 17

讨论操作

快速查看讨论及其快照的属性,并进行相关操作。

当前回复
17 条
当前快照
1 份
快照标识符
@lo8q4m6i
此快照首次捕获于
2023/10/27 22:43
2 年前
此快照最后确认于
2024/08/21 20:46
2 年前
查看原帖
众所周知,自从初代棋类ai alphago 到 alphazero 再到 muzero,都用到了蒙特卡洛树搜索算法,我自然也想用。但是众所周知,alpha系列算法只能解决对称信息零和博弈,而generals属于非对称信息零和博弈(1v1模式)。我本来的想法是在mcts扩展步骤的时候用人类下棋数据监督学习一个对手棋形预测器,希望这个预测器能够按概率预测对手棋形。举个例子,经过计算,在已有信息下,对手棋形为a形的概率为1%,那这个预测器就有1%的概率输出a。但是经过我的仔细思考,以及小学四年级以前的围棋训练和五段水平,我认为不需要这么麻烦,而且仔细一听就知道这个模型收敛要过很久很久。因为我认为,generals具有以下特点:
  • 相对于围棋,generals更为连续,甚至我认为可以把generals棋形近似成波。
  • 相对于围棋,generals可选操作更多,但是多数操作的效果都是一样的,不像围棋,差一格导致的差别就十万八千里。
所以我认为可以不使用alpha系列算法的模式,我认为应该降低我要写的东西的计算深度和广度,并且可以考虑不使用mcts。对了,mcts没啥神奇的,用途和原理类似于启发式搜索+模拟退火+随机化贪心。

回复

17 条回复,欢迎继续交流。

正在加载回复...