正如问题所述,我正在寻找一个很好的解释/示例,以加强在pybrain中的学习,因为这方面的文档给我带来了无尽的困惑,我可以让它开始工作,但我不知道如何将它应用于其他事情。
谢谢汤姆
发布于 2015-11-13 16:08:15
不幸的是,pybrain的rl类文档是令人失望的。我发现这个博客很有用。
总之,您需要标识以下组件(有关实现的详细信息,请参阅有关链接的教程):
env = Environment(...)task = Task(env)controller = Module(...)。learner = SARSA() -->您也可以向学习者添加资源管理器。默认情况下,epsilon贪婪,epsilon= 0.3,衰减= 0.9999.agent = Agent(controller, learner)experiment = Experiment(task, agent)每个大写类都应该替换为来自PyBrain.Then的相应类,您只需运行一个do-while循环来执行迭代和学习。请注意,用户需要设置几个选项,在实际问题中,您很可能需要编写子类来概括pybrain的基本类,但是步骤将与这里相同。
https://stackoverflow.com/questions/30819133
复制相似问题