我有一个关于MCTS的基本问题。我的问题是关于start状态的处理。据我所知,搜索树是通过对有效操作的分支构建的,每次在相同的状态下开始时,都会导致相同的搜索树被遍历。但是,如果每次游戏开始时,游戏的开始状态是不同的呢?(例如,处理不同的卡片),这是否导致多根节点实质上导致N个不同的搜索树与N个可能组合的已处理的牌?这不意味着如果开始状态不同,我在以前的游戏中构建的搜索树是无用的吗?在MCTS中如何处理不同的开始状态?
提前谢谢你。
发布于 2013-09-14 05:12:58
据我所知,MCTS用于极小极大树的快速逼近.这里没有“不同的开始节点”--您可以运行算法,给定特定的当前状态,以找到最佳的答案/移动。在纸牌游戏中--一旦你看到你的牌,,等等,你就会运行它。在非确定性游戏中,“问题”通常会出现,因为你不确定特定移动的结果(因为游戏规则的随机性等等)。这种情况被称为“非确定性游戏”(骰子游戏)或“有部分信息的游戏”(如纸牌游戏)。每种方法都有MCTS的开发方法。
我建议您看看http://mcts.ai/,在那里您可以找到MCTS相关论文的优秀库。
https://stackoverflow.com/questions/18786374
复制相似问题