首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我可以使用启发式在蒙特卡洛搜索树的播放阶段获得结果吗?

我可以使用启发式在蒙特卡洛搜索树的播放阶段获得结果吗?
EN

Stack Overflow用户
提问于 2016-07-27 02:21:12
回答 2查看 76关注 0票数 1

根据我的理解,MCTS中的播放或模拟阶段的目标是获得一个结果,并在反向传播期间奖励或惩罚从根开始的路径上的节点。(如有错误,请指正)

我的问题是,我是否可以使用领域知识启发式来获得这个结果,而不是真正地模拟游戏到最后。

我问的原因是,我正在做一些类似于寻路的事情,目标是找到通往目标状态(节点)的路径,这意味着在我的情况下,从头到尾模拟游戏是非常困难的。

EN

回答 2

Stack Overflow用户

发布于 2016-08-23 03:33:49

是的,你当然可以。我个人在一些游戏领域做过这样的事情,在这些领域中,在到达终端状态之前,一直运行适量的模拟是不可行的。

如果您总是提前终止模拟并使用启发式评估函数对其进行评估,您将失去UCT (最常见的MCTS实现)在给定无限处理时间的情况下找到最佳操作的保证,但实际上您很少有无限的处理时间。在可以运行足够的模拟直到结束的领域中,这可能是有害的(除非它是一个非常好的启发式函数,并且允许您运行更多的模拟)。

票数 1
EN

Stack Overflow用户

发布于 2016-09-30 13:57:06

我找到了这篇论文"Monte-Carlo Planning for Pathfinding in Real-Time Strategy Games“。它使用欧几里德距离的倒数作为奖励。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38597244

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档