问强化学习，Q学习来确定最佳施法顺序？
EN

Stack Overflow用户

提问于 2020-05-19 22:15:57

回答 1查看 34关注 0票数 0

如果我有一个巫师，他有20个法术，每个法术都做不同的事情，有时直接伤害，有时致残，有时保护等等。他与10个兽人战斗，我想确定一个最优的施法顺序，以尽可能快地杀死兽人。

Q学习对解决这个问题有帮助吗？

我可以从20个法术的初始状态开始，然后每一个状态都是我剩下的法术，最后的状态是巫师或半兽人死亡。这有什么意义吗?还是我试图为这项工作使用错误的AI算法？

发布于 2020-05-20 18:12:34

在我看来没问题。您正在寻找改变状态的操作轨迹。也就是说，你的玩家和兽人的健康状况会让你在某一特定状态下获得奖励。即杀死半兽人。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/61893293

复制

相似问题

问强化学习，Q学习来确定最佳施法顺序？EN