我建立了一个自定义开放的人工智能健身房环境,使用简单的元组观测空间。
self.observation_space = spaces.Tuple((spaces.Discrete(2,),spaces.Discrete(1)))但是当我尝试使用q-学习示例时,他们会使用
observation_space.n在这种观察空间中,有没有一种使用Q学习的方法?
发布于 2021-12-07 11:37:56
只是遇到了同样的问题,以防有人还在阅读:由于元组空间没有属性n,我使用了一个解决方法,只需自己定义它:self.observation_space.n = self.dimension1 * self.dimension2基本上是将元组的离散空间输入参数乘以。希望这是有意义的
https://stackoverflow.com/questions/61399709
复制相似问题