首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >不需要预训练的连续实时学习的RNN

不需要预训练的连续实时学习的RNN
EN

Data Science用户
提问于 2022-09-11 02:30:25
回答 1查看 28关注 0票数 0

我正在学习ML,我正在努力解决这个问题

创建一个石头剪刀游戏,其中人工智能能够击败超过50%的时间。

我最初的直觉是使用带有LSTM的RNN。我想象着我的人工智能,分析了P1的动作历史,并猜测下一个可能是什么。

现在,我的问题是。我不想事先想出一堆数据来训练模型,而是让模型实时地学习每个玩家是如何玩的,并且在游戏中逐渐变得更好,直到它能够合理地预测玩家的动作。

思考了一段时间后,我在谷歌上搜索了提示符,并阅读了其他人的解决方案。我所看到的全部都是训练前的路线。创建能够生成半随机移动序列(r,p,s,s,p,etc..)的复杂算法,并利用该算法对模型进行训练。

我对这样做的担心是,它导致了对先前数据的严重依赖,与我面前的球员现在的表现相比,这是很好的。为了让我的人工智能变得好,我需要花费大量的时间来创建(广泛的)训练数据来训练它,而不是从我所面对的球员那里学习。

这就是我们必须做的事情吗?我所设想的是可能的吗?这是解决问题的正确方法吗?

EN

回答 1

Data Science用户

回答已采纳

发布于 2022-09-11 11:27:40

我会调查一下马尔可夫链

这是一个非常常见的问题,与许多人 方法

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/114310

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档