我正在学习ML,我正在努力解决这个问题
创建一个石头剪刀游戏,其中人工智能能够击败超过50%的时间。
我最初的直觉是使用带有LSTM的RNN。我想象着我的人工智能,分析了P1的动作历史,并猜测下一个可能是什么。
现在,我的问题是。我不想事先想出一堆数据来训练模型,而是让模型实时地学习每个玩家是如何玩的,并且在游戏中逐渐变得更好,直到它能够合理地预测玩家的动作。
思考了一段时间后,我在谷歌上搜索了提示符,并阅读了其他人的解决方案。我所看到的全部都是训练前的路线。创建能够生成半随机移动序列(r,p,s,s,p,etc..)的复杂算法,并利用该算法对模型进行训练。
我对这样做的担心是,它导致了对先前数据的严重依赖,与我面前的球员现在的表现相比,这是很好的。为了让我的人工智能变得好,我需要花费大量的时间来创建(广泛的)训练数据来训练它,而不是从我所面对的球员那里学习。
这就是我们必须做的事情吗?我所设想的是可能的吗?这是解决问题的正确方法吗?
https://datascience.stackexchange.com/questions/114310
复制相似问题