问AlphaGo零损失函数如何度量MCTS概率和NN概率之间的相似性？
EN

Stack Overflow用户

提问于 2017-11-06 22:02:09

回答 1查看 493关注 0票数 1

正如您在图像中看到的，MCT零神经网络使用损失函数，该函数使用AlphaGo概率和值作为地面实况标签。我正在尝试理解神经网络的输出是否被视为对数(例如实数)或原始概率(0,1)。在损失函数中，MCTS概率(我确信它位于0,1)是向量乘以NN概率的对数。这是损失中的一个负项，但是关于两个向量的相似性，这个项的大小表明了什么？为什么更大的值表示更多的相似性？

machine-learning

回答 1

Stack Overflow用户

发布于 2017-11-06 22:11:49

正如here解释的那样，它被证明是交叉熵损失的蒙特卡洛估计。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/47138694

复制

相似问题

问AlphaGo零损失函数如何度量MCTS概率和NN概率之间的相似性？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问AlphaGo零损失函数如何度量MCTS概率和NN概率之间的相似性？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问AlphaGo零损失函数如何度量MCTS概率和NN概率之间的相似性？
EN