首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何将游戏规则传授给ai?

如何将游戏规则传授给ai?
EN

Stack Overflow用户
提问于 2019-05-16 19:06:00
回答 1查看 57关注 0票数 1

我正在使用DQN让AI像alpha GO。但我在教授游戏规则方面遇到了麻烦。AI不知道一条规则,“第一次不能把石头放到已经有人住的地方”。每当AI违反这条规则时,我都会尝试给负奖励。但它看起来并不像AI学习规则。我认为教授规则只是浪费时间。请与我分享你的想法。

EN

回答 1

Stack Overflow用户

发布于 2019-05-23 17:49:04

你可以做的是,当你在一个状态's‘时,你有8个可能的动作(所以你的网络有8个输出),但是动作1,2,3是不可执行的,你可以通过手动将状态's’中所有无效动作的目标Q值设置为0来最小化损失。

对于训练步骤,当对应于最大Q值的动作无效时,只需选择一个随机动作,不要忘记将该动作的目标Q值设置为0。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56167116

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档