OpenAI健身房真正实现了强化学习方式的规范化。它使数据科学家能够将模型开发和环境设置/构建分开,并将重点放在他们真正应该关注的方面。
引用健身网站的话:
背景:为什么健身房(2016)强化学习(RL)是与决策和运动控制相关的机器学习的子领域。它研究一个agent如何在复杂的、不确定的环境中学习如何实现目标。令人兴奋的原因有两个:
然而,RL的研究也因以下两个因素而放缓:
健身房是一种解决这两个问题的尝试。
我在想,是否有类似于监督学习或非监督学习的东西。我认为,出于同样的原因,这种工具将是有用的。我是不是遗漏了什么?还是已经有什么东西了?
发布于 2021-06-06 18:51:34
整齐的数据是一种标准的表示有监督和无监督学习的数据的方法。Tidy将数据放入表格形式,其中每一行都是一个观察,每一列都是一个特性。一旦数据以这种形式出现,就可以进行机器学习建模。
https://datascience.stackexchange.com/questions/90330
复制相似问题