首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >具有不同训练算法的多智能体RLIB

具有不同训练算法的多智能体RLIB
EN

Stack Overflow用户
提问于 2020-02-24 08:27:22
回答 1查看 153关注 0票数 1

在RLLIB中,可以有多个具有不同学习算法的代理吗?(例如:一个使用DQN的代理和一个使用Q-Learning的代理)?

EN

回答 1

Stack Overflow用户

发布于 2020-02-25 13:35:49

是的,这是可能的。请参阅documentation中的示例

训练器= pg.PGAgent(env="my_multiagent_env",config={ "multiagent":{ "policies":{#第一个元组值为None ->使用默认策略"car1":(None,car_obs_space,car_act_space,{"gamma":0.85}),"car2":(None,car_obs_space,car_act_space,{"gamma":0.99}),"traffic_light":(None,tl_obs_space,tl_act_space,{}),},"policy_mapping_fn":lambda agent_id:"traffic_light“#如果agent_id.startswith("traffic_light_") else random.choice("car1","car2") #从汽车策略中随机选择},红绿灯始终由该策略控制},})而True: print(trainer.train())

其中每一个都有不同的PG算法。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60368213

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档