我有一些关于强化学习的问题。我已经研究了强化学习的所有数学背景,但我不能编写这个模型的代码。
我对环境的定义感到非常困惑。我们可以使用OpenAI健身房来解决各种问题吗?这对我来说没有任何意义。例如,玩游戏与股票预测是不同的。但是为什么我发现在这两种情况下都有人在使用OpenAI健身房呢?
我还发现了下面的列表。论文到底是什么?它们是实现强化学习模型的框架吗?

你能给我一个链接,来源,视频,课程或任何可以让我明白的东西吗?
发布于 2020-10-30 02:54:37
OpenAI健身房是环境的集合。如果你研究过RL的数学背景,那么健身房只是一个MDP的集合。然后,由您将RL算法与这些MDP挂钩,并进行实际学习。
你找到的那个列表可能有点旧了,因为rllab最近被重命名为garage。我不知道它们中的大多数,但我想说它们是已经实现的RL算法的库(至少rllab和OpenAI基线是这样的)。你可以看看他们的代码,看看他们是如何实现不同的RL算法的。
https://stackoverflow.com/questions/64597298
复制相似问题