首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >TestEnv类的作用到底是什么?

TestEnv类的作用到底是什么?
EN

Stack Overflow用户
提问于 2019-11-21 06:26:22
回答 1查看 28关注 0票数 0

我正在尝试运行/examples/rllib文件夹中的stabilizing_highway.py脚本,并收集了一组学习检查点。现在,我想将学习带来的改进与基线场景进行比较,就像没有自主代理时会发生什么一样。

我最近遇到了一个TestEnv类。如果我在相同的代码中用TestEnv替换当前的WaveAttenuationMergePOEnv env_name,它会在完全相同的配置下模拟非常正常的人类驾驶行为,而不需要学习吗?

这会是一个被视为基准的好复制品吗?

EN

回答 1

Stack Overflow用户

发布于 2019-12-13 22:35:01

由于您的问题是在一段时间之前提出的,您可能自己找到了答案,但我仍然尝试为其他有此问题的人回答这个问题: TestEnv类用于进行没有任何训练目标的模拟。因此,它计算零奖励,并定义空的动作空间和观察空间。据我所知,它的目的正是您所要求的。

BR,Vallout

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58964346

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档