社区讨论
generals ai进度汇报
学术版参与者 6已保存回复 17
讨论操作
快速查看讨论及其快照的属性,并进行相关操作。
- 当前回复
- 17 条
- 当前快照
- 1 份
- 快照标识符
- @lo8q4m6i
- 此快照首次捕获于
- 2023/10/27 22:43 2 年前
- 此快照最后确认于
- 2024/08/21 20:46 2 年前
众所周知,自从初代棋类ai alphago 到 alphazero 再到 muzero,都用到了蒙特卡洛树搜索算法,我自然也想用。但是众所周知,alpha系列算法只能解决对称信息零和博弈,而generals属于非对称信息零和博弈(1v1模式)。我本来的想法是在mcts扩展步骤的时候用人类下棋数据监督学习一个对手棋形预测器,希望这个预测器能够按概率预测对手棋形。举个例子,经过计算,在已有信息下,对手棋形为a形的概率为1%,那这个预测器就有1%的概率输出a。但是经过我的仔细思考,以及小学四年级以前的围棋训练和五段水平,我认为不需要这么麻烦,而且仔细一听就知道这个模型收敛要过很久很久。因为我认为,generals具有以下特点:
- 相对于围棋,generals更为连续,甚至我认为可以把generals棋形近似成波。
- 相对于围棋,generals可选操作更多,但是多数操作的效果都是一样的,不像围棋,差一格导致的差别就十万八千里。
所以我认为可以不使用alpha系列算法的模式,我认为应该降低我要写的东西的计算深度和广度,并且可以考虑不使用mcts。对了,mcts没啥神奇的,用途和原理类似于启发式搜索+模拟退火+随机化贪心。
回复
共 17 条回复,欢迎继续交流。
正在加载回复...