问如何实现强化学习模型？
EN

Stack Overflow用户

提问于 2020-10-30 02:38:56

回答 1查看 98关注 0票数 2

我有一些关于强化学习的问题。我已经研究了强化学习的所有数学背景，但我不能编写这个模型的代码。

我对环境的定义感到非常困惑。我们可以使用OpenAI健身房来解决各种问题吗？这对我来说没有任何意义。例如，玩游戏与股票预测是不同的。但是为什么我发现在这两种情况下都有人在使用OpenAI健身房呢？

我还发现了下面的列表。论文到底是什么？它们是实现强化学习模型的框架吗？

你能给我一个链接，来源，视频，课程或任何可以让我明白的东西吗？

发布于 2020-10-30 02:54:37

OpenAI健身房是环境的集合。如果你研究过RL的数学背景，那么健身房只是一个MDP的集合。然后，由您将RL算法与这些MDP挂钩，并进行实际学习。

你找到的那个列表可能有点旧了，因为rllab最近被重命名为garage。我不知道它们中的大多数，但我想说它们是已经实现的RL算法的库(至少rllab和OpenAI基线是这样的)。你可以看看他们的代码，看看他们是如何实现不同的RL算法的。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/64597298

复制

相似问题

问如何实现强化学习模型？EN