在RLLIB中,可以有多个具有不同学习算法的代理吗?(例如:一个使用DQN的代理和一个使用Q-Learning的代理)?
发布于 2020-02-25 13:35:49
是的,这是可能的。请参阅documentation中的示例
训练器= pg.PGAgent(env="my_multiagent_env",config={ "multiagent":{ "policies":{#第一个元组值为None ->使用默认策略"car1":(None,car_obs_space,car_act_space,{"gamma":0.85}),"car2":(None,car_obs_space,car_act_space,{"gamma":0.99}),"traffic_light":(None,tl_obs_space,tl_act_space,{}),},"policy_mapping_fn":lambda agent_id:"traffic_light“#如果agent_id.startswith("traffic_light_") else random.choice("car1","car2") #从汽车策略中随机选择},红绿灯始终由该策略控制},})而True: print(trainer.train())
其中每一个都有不同的PG算法。
https://stackoverflow.com/questions/60368213
复制相似问题