我正在努力学习和使用强化学习。现在,我的数据集中只有6个数字特性。我还能用RL吗?换句话说,是否可以使用RL来实现这样一些合理的特性?
发布于 2020-05-17 09:06:58
在学习RL的基础知识(相对于使用神经网络的深层RL )时,考虑单个离散状态变量是比较常见的。例如,许多网格世界、迷宫求解者等等只是列举了这些位置。对于实际学习者来说,变量是有效的一个热编码,但它仍然是一个单一的变量.
状态特性的数量与RL是否适用无关。
假设您正确地将问题描述为马尔可夫决策过程(MDP),那么需要考虑的重要事项是:
发布于 2020-05-17 04:43:52
它实际上取决于您有多少数据(样本),而不是每个样本有多少特性。更重要的是,这取决于你计划如何将问题组织成一个有国家和行动的环境。
https://datascience.stackexchange.com/questions/74316
复制相似问题