首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏oeasy教您玩转linux、python

    [oeasy]python0096_游戏娱乐行业_雅达利_米洛华_四人赛马_影视结合游戏

    一年没有发行游戏 其他公司 的 游戏机 蜂起 包括 硅谷源头的传奇 仙童公司 atari2600 LSI 超大规模集成电路 最终 进化为 cpu 雅达利 研发 基于6502系列cpu的 atari

    32110编辑于 2023-02-28
  • 来自专栏arXiv每日学术速递

    人工智能学术速递[6.24]

    -2600 Benchmark 标题:基于宽度的Lookahead,在Atari-2600基准上学习基本策略和启发式算法 作者:Stefan O'Toole,Nir Lipovetzky,Miquel 我们在Atari-2600游戏中对我们的新算法进行了测试,结果表明,我们的最佳算法RIW$\U C$+CPV的性能优于先前引入的基于宽度的规划和学习算法$\pi$-IW(1)、$\pi$-IW(1)+和 此外,我们还根据Atari-2600游戏的一些定义特征对它们进行了分类。通过对游戏的分析,可以进一步了解基于宽度的算法的行为和性能。 摘要:We propose new width-based planning and learning algorithms applied over the Atari-2600 benchmark. We benchmark our new algorithms over the Atari-2600 games and show that our best performing algorithm

    1.7K20发布于 2021-07-02
  • 来自专栏深度强化学习实验室

    深度强化学习的加速方法

    为了提供校准结果,作者通过Arcade学习环境(ALE)测试我们在重度基准测试的Atari-2600域中的实现。 3、实验 使用Atari-2600域来研究高度并行化RL的缩放特性,研究如下: + 1)同步采样的效率如何,它可以达到什么速度?

    2.2K11发布于 2019-09-17
  • 来自专栏深度强化学习实验室

    【重磅】深度强化学习的加速方法

    为了提供校准结果,作者通过Arcade学习环境(ALE)测试我们在重度基准测试的Atari-2600域中的实现。 3、实验 使用Atari-2600域来研究高度并行化RL的缩放特性,研究如下: + 1)同步采样的效率如何,它可以达到什么速度?

    2.1K20发布于 2019-11-20
领券