我正在为一个小游戏实现minimax,并注意到一些我称之为“拖延”的东西。归结为一个非常简单的例子:
在捕获旗帜的游戏中,旗帜在玩家A的正方形上,而玩家B在50个空格之外。轮到A了,他可以向前搜索6步。我看到的是,所有可能的走法都有一个"Win“值,因为A知道他可以在B之前到达旗子,即使他没有立即抓住它。因此,如果UP是排序中的最后一步,他将左右移动一段时间,直到B在打击距离内,然后他必须最终获得旗帜。
起初,这种行为看起来像是一个bug,但通过它,我说服了自己,每一步都是真正的“胜利”,但行为并不好。我可以通过使从现在开始捕获的4步标志比现在捕获的标志更有价值来影响评估,但我想知道minimax搜索是否有比我丢失的更多的方面?有没有什么概念认为,比起同样高的分数,更早的分数是最可取的?
发布于 2012-05-30 09:50:49
minimax搜索本身没有任何东西可以让我们更快地获胜。由于所有终端位置的评估得分相同,因此该算法有效地随机选择一个移动。让你的评估函数在树中更深的地方稍微降低每个级别的获胜分数,minimax将选择更快的获胜。
https://stackoverflow.com/questions/10787749
复制相似问题