文章/答案/技术大牛

发布

社区首页 >问答首页 >不需要预训练的连续实时学习的RNN

问不需要预训练的连续实时学习的RNN
EN

Data Science用户

提问于 2022-09-11 02:30:25

回答 1查看 28关注 0票数 0

我正在学习ML，我正在努力解决这个问题

创建一个石头剪刀游戏，其中人工智能能够击败超过50%的时间。

我最初的直觉是使用带有LSTM的RNN。我想象着我的人工智能，分析了P1的动作历史，并猜测下一个可能是什么。

现在，我的问题是。我不想事先想出一堆数据来训练模型，而是让模型实时地学习每个玩家是如何玩的，并且在游戏中逐渐变得更好，直到它能够合理地预测玩家的动作。

思考了一段时间后，我在谷歌上搜索了提示符，并阅读了其他人的解决方案。我所看到的全部都是训练前的路线。创建能够生成半随机移动序列(r,p,s,s,p,etc..)的复杂算法，并利用该算法对模型进行训练。

我对这样做的担心是，它导致了对先前数据的严重依赖，与我面前的球员现在的表现相比，这是很好的。为了让我的人工智能变得好，我需要花费大量的时间来创建(广泛的)训练数据来训练它，而不是从我所面对的球员那里学习。

这就是我们必须做的事情吗？我所设想的是可能的吗?这是解决问题的正确方法吗？

lstm

rnn

training

game

回答 1

Data Science用户

回答已采纳

发布于 2022-09-11 11:27:40

我会调查一下马尔可夫链

这是一个非常常见的问题，与许多人方法。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/114310

复制

相似问题

问不需要预训练的连续实时学习的RNN
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问不需要预训练的连续实时学习的RNNEN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问不需要预训练的连续实时学习的RNN
EN