我想创建一个强化学习模型使用稳定的基础3 PPO,可以驱动OpenAI健身房赛车环境,我一直有很多错误和包兼容性问题。我现在有这段代码,只是用于随机操作。
import gym
from stable_baselines3 import PPO
environment_name = "CarRacing-v0"
env = gym.make(environment_name)
episodes = 5
for episode in range(1, episodes+1):
state = env.reset()
done = False
score = 0
while not done:
env.render()
action = env.action_space.sample()
n_state, reward, done, info = env.step(action)
score+=reward
print('Episode:{} Score:{}'.format(episode, score))
env.close()运行在Ubuntu20.04,在VSCode木星笔记本。在conda env中使用这些包

即使是随机操作,我目前在state = env.reset()上也有一个错误

我试过不同版本的健身房和其他套餐,但似乎都没有完美的效果。请任何人帮助我,我唯一的要求是使它工作(首先是随机的,然后与PPO),无论哪个版本的软件包。
谢谢
发布于 2022-10-08 04:41:41
你好,好像环境有错误
将environment_name = "CarRacing-v0"改为environment_name = "CarRacing-v2"它可能会修复erorr
如果不工作,请卸载并重新安装
pip uninstall stable-baselines3[extra] 或
pip uninstall stable-baselines3卸载后再安装它
pip install stable-baselines3[extra]记住,
你需要安装如果你没有安装它可能是问题https://pytorch.org/get-started/locally/
(对迟答表示歉意)
https://stackoverflow.com/questions/73688998
复制相似问题