我试着在低速环境下运行DRL,而连续学习让我很不爽。是否有加速学习的过程?我尝试了一些离线深入强化学习,但我仍然需要更高的速度(如果可能的话)。
发布于 2021-12-23 14:38:10
你在找矢量化环境。它们将允许与您的环境进行并行交互。
https://stackoverflow.com/questions/70340806
相似问题