首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >NGU、R2D2、MuZero和Agent57在强化学习分类学中的地位如何?

NGU、R2D2、MuZero和Agent57在强化学习分类学中的地位如何?
EN

Stack Overflow用户
提问于 2020-05-02 08:19:54
回答 1查看 328关注 0票数 1

OpenAI有一个很好的强化学习算法分类学。我想知道在这棵树上下面的文件会去哪里?

  1. 绝对不能放弃
  2. Agent57
  3. MuZero
  4. R2D2

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-05-04 18:55:10

我正在制作一个RL分类法1,最近不得不自己回答这个问题。这是我对它的看法。

  • Agent57是基于NGU的,而NGU又是基于R2D2的,后者代表递归重放分布式DQN。所以它们都是Q学习,没有模型的RL。
  • MuZero是基于模型的,它正在学习这个模型。这是在论文(第2页,第一次声明)和在Agent57论文中提到的。

1

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/61556374

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档