腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
蒙特卡洛
树
搜索
我目前正在为一个简单的棋盘游戏开发一个MCTS实现。我想我几乎是正确的,但每当我想迭代超过1次(时间或数字(I)作为迭代的因素)时,游戏就会冻结。如果有人对这个问题有一个可靠的想法,我会很高兴的。 Node findBest( ) Node startingPoint = new Node(); startingPoint.CurrentField_H = GameB
浏览 0
修改于2017-12-21
得票数 0
1
回答
什么是神经网络中的
蒙特卡洛
波束
搜索
?
蒙特卡洛
波束
搜索
在神经网络和强化学习的研究中经常被引用。它是什么?它与
蒙特卡洛
搜索
有何不同。
浏览 5
提问于2019-06-05
得票数 0
1
回答
了解
蒙特卡洛
树
搜索
我对
蒙特卡洛
树
搜索
的理解和编码如下: class MCTS(object): def __init__(self, action_size, movesets, nsims, ndepth):
浏览 19
提问于2019-09-26
得票数 1
回答已采纳
3
回答
当
蒙特卡洛
树
搜索
达到内存限制时该怎么办
我最近对
蒙特卡洛
树
搜索
在游戏中的应用产生了兴趣。我读过几篇论文,但我还是使用了Chaslot的博士论文“
蒙特卡洛
树
搜索
”,因为我发现更容易理解
蒙特卡洛
树
搜索
的基础知识 我试着对它进行编码,并纠结于某些问题。
浏览 6
修改于2013-04-19
得票数 7
1
回答
蒙特卡洛
树
搜索
的改进
我正在尝试在一个游戏上实现MCTS算法。我每次移动只能使用大约0.33秒。在这段时间内,我可以从start状态为每个孩子生成一到两个游戏,其中包含大约500个子节点。我的模拟不是随机的,但我当然不能基于一两个模拟做出正确的选择。在游戏中,树变得更小,我可以,我的选择是基于更多的模拟。
浏览 4
修改于2018-02-20
得票数 2
1
回答
为什么
蒙特卡洛
树
搜索
的UCB公式中存在对数(和平方根)?
我从几个来源研究了
蒙特卡洛
树
搜索
,比如:公式如下:
浏览 4
修改于2022-08-01
得票数 1
1
回答
蒙特卡洛
树
搜索
TicTacToe不会阻止对手的制胜动作
我用
蒙特卡洛
树
搜索
( Monte Search,MCTS)和UCB1进行节点选择,我制作了一个程序来对一个人播放UCB1。该程序将播放移动,直到它赢了,但它不会作出任何尝试,以阻止其他玩家。
浏览 0
提问于2016-12-11
得票数 -2
1
回答
蒙特卡洛
树
搜索
:从推出中获取值
我目前正在编写蒙特卡罗树
搜索
策略游戏AI的实现,并有一个关于推出(模拟阶段)的问题。 该算法的描述表明,在到达终端状态之前,您应该运行模拟,但是当
搜索
空间很大且时间有限时,这是不切实际的。
浏览 9
提问于2020-05-28
得票数 2
2
回答
播放或访问为0时
蒙特卡洛
树
搜索
的置信度上限
我正在看“
蒙特卡洛
树
搜索
”算法的“上置信限”。
浏览 0
修改于2020-12-22
得票数 2
回答已采纳
2
回答
“
蒙特卡洛
树
搜索
”可以应用于“不完全信息的两人博弈”吗?
我发现
蒙特卡洛
树
搜索
也被用于开发零和双人游戏。它能用在像《战略号》这样的游戏中吗?我能得到一个同样的完整教程吗? 任何其他不涉及
蒙特卡洛
树
搜索
的教程也会很有用:)
浏览 0
提问于2012-10-13
得票数 5
回答已采纳
2
回答
蒙特卡洛
树
搜索
或随机纸牌游戏的其他算法?
我读到了很多关于
蒙特卡洛
树
搜索
和相关的UCT
搜索
的有趣的东西,但是因为游戏中有随机元素,所以需要
搜索
的树会在短时间内变得很大。 哪种算法或方法是最好的?
浏览 3
提问于2012-06-14
得票数 7
1
回答
蒙特卡洛
树
搜索
中每个节点的模拟次数
与我使用alpha-beta剪枝的启发式
搜索
相比,结果很糟糕。它的收敛速度非常慢。当我改为执行500次播放时,噪音要小得多。
浏览 9
修改于2018-02-20
得票数 2
回答已采纳
1
回答
蒙特卡洛
树
搜索
:对手在MCTS树边界之前移动
MCTS算法的步骤如下: 我对第一部分感到困惑。为了模拟游戏,我们首先在第一个节点采取我们的树策略,然后对手移动,然后再采取另一个树策略移动,等等,直到我们到达在算法的步骤2中创建的节点。在我们到达树线之前,我们应该让对手在我们的树策略移动之间做些什么?一个随
浏览 0
提问于2017-06-23
得票数 2
回答已采纳
2
回答
蒙特卡洛
树
搜索
:两人博弈的树策略
即使我选择了MIN可能采取的一些特定操作,并且我的
搜索
树更深入地遍历了该节点,MIN玩家在轮到它的过程中也可能选择一些不同的节点。
浏览 23
修改于2017-02-18
得票数 7
1
回答
蒙特卡洛
树
搜索
Tic-Tac-Toe --可怜的特工
我正在尝试实现
蒙特卡洛
树
搜索
,以便在Python中玩tic。我目前的实现如下: return col_sum or row_sum or d1_sum or d2_sumdef UCT(rootstate, maxiters): ro
浏览 0
修改于2018-03-23
得票数 4
回答已采纳
1
回答
当得分在0到n之间时
蒙特卡洛
树
搜索
的UCB公式
我正在实现一个使用
蒙特卡洛
树
搜索
来播放2048的人工智能。根据维基百科、和我在扩展步骤中检查过的所有其他来源,您应该使用UCB公式来确定要访问wi/ni + c*sqrt(ln(N)/ni)的节点。
浏览 5
修改于2019-09-05
得票数 1
4
回答
蒙特卡洛
树
搜索
,反向传播(备份)步骤:为什么改变奖励价值的观点?
我一直在阅读Browne等人的
蒙特卡洛
树
搜索
调查论文。艾尔: 在第9页中,我只处理了一段伪代码。我的问题在备份和BackupNegamax函数中都是以类似的形式出现的。
浏览 4
提问于2015-05-28
得票数 6
回答已采纳
2
回答
我可以使用启发式在
蒙特卡洛
搜索
树的播放阶段获得结果吗?
根据我的理解,MCTS中的播放或模拟阶段的目标是获得一个结果,并在反向传播期间奖励或惩罚从根开始的路径上的节点。(如有错误,请指正)我问的原因是,我正在做一些类似于寻路的事情,目标是找到通往目标状态(节点)的路径,这意味着在我的情况下,从头到尾模拟游戏是非常困难的。
浏览 0
修改于2016-07-27
得票数 1
1
回答
并行蒙特卡罗树
搜索
我有一个
蒙特卡洛
树
搜索
实现,我需要优化。因此,我考虑了并行化的推出阶段。怎么做?(是否有代码示例)。有您推荐的python模块等吗? 如果这个地方不适合发这个,我很抱歉。
浏览 0
提问于2019-04-08
得票数 1
回答已采纳
4
回答
预测中的蒙特卡罗模拟?
我还有一些关于
蒙特卡洛
模拟的信息。我想和
蒙特卡洛
一起学习金融预测。你有什么想法吗?你对财务决策编程有什么看法?
蒙特卡洛
模拟金融软件的未来如何?
浏览 1
修改于2009-06-03
得票数 1
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券