如果我有一个巫师,他有20个法术,每个法术都做不同的事情,有时直接伤害,有时致残,有时保护等等。他与10个兽人战斗,我想确定一个最优的施法顺序,以尽可能快地杀死兽人。
Q学习对解决这个问题有帮助吗?
我可以从20个法术的初始状态开始,然后每一个状态都是我剩下的法术,最后的状态是巫师或半兽人死亡。这有什么意义吗?还是我试图为这项工作使用错误的AI算法?
发布于 2020-05-20 18:12:34
在我看来没问题。您正在寻找改变状态的操作轨迹。也就是说,你的玩家和兽人的健康状况会让你在某一特定状态下获得奖励。即杀死半兽人。
https://stackoverflow.com/questions/61893293
复制相似问题