首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >强化学习,Q学习来确定最佳施法顺序?

强化学习,Q学习来确定最佳施法顺序?
EN

Stack Overflow用户
提问于 2020-05-19 22:15:57
回答 1查看 34关注 0票数 0

如果我有一个巫师,他有20个法术,每个法术都做不同的事情,有时直接伤害,有时致残,有时保护等等。他与10个兽人战斗,我想确定一个最优的施法顺序,以尽可能快地杀死兽人。

Q学习对解决这个问题有帮助吗?

我可以从20个法术的初始状态开始,然后每一个状态都是我剩下的法术,最后的状态是巫师或半兽人死亡。这有什么意义吗?还是我试图为这项工作使用错误的AI算法?

EN

回答 1

Stack Overflow用户

发布于 2020-05-20 18:12:34

在我看来没问题。您正在寻找改变状态的操作轨迹。也就是说,你的玩家和兽人的健康状况会让你在某一特定状态下获得奖励。即杀死半兽人。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/61893293

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档