搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏oeasy教您玩转linux、python
[oeasy]python0096_游戏娱乐行业_雅达利_米洛华_四人赛马_影视结合游戏
一年没有发行游戏其他公司的游戏机蜂起包括硅谷源头的传奇仙童公司 atari2600 LSI 超大规模集成电路最终进化为 cpu 雅达利研发基于6502系列cpu的 atari
32110编辑于 2023-02-28
来自专栏arXiv每日学术速递
人工智能学术速递[6.24]
-2600 Benchmark 标题：基于宽度的Lookahead，在Atari-2600基准上学习基本策略和启发式算法作者：Stefan O'Toole,Nir Lipovetzky,Miquel 我们在Atari-2600游戏中对我们的新算法进行了测试，结果表明，我们的最佳算法RIW$\U C$+CPV的性能优于先前引入的基于宽度的规划和学习算法$\pi$-IW（1）、$\pi$-IW（1）+和此外，我们还根据Atari-2600游戏的一些定义特征对它们进行了分类。通过对游戏的分析，可以进一步了解基于宽度的算法的行为和性能。摘要：We propose new width-based planning and learning algorithms applied over the Atari-2600 benchmark. We benchmark our new algorithms over the Atari-2600 games and show that our best performing algorithm
1.7K20发布于 2021-07-02
来自专栏深度强化学习实验室
深度强化学习的加速方法
为了提供校准结果，作者通过Arcade学习环境（ALE）测试我们在重度基准测试的Atari-2600域中的实现。 3、实验使用Atari-2600域来研究高度并行化RL的缩放特性，研究如下： + 1）同步采样的效率如何，它可以达到什么速度？
2.2K11发布于 2019-09-17
来自专栏深度强化学习实验室
【重磅】深度强化学习的加速方法
为了提供校准结果，作者通过Arcade学习环境（ALE）测试我们在重度基准测试的Atari-2600域中的实现。 3、实验使用Atari-2600域来研究高度并行化RL的缩放特性，研究如下： + 1）同步采样的效率如何，它可以达到什么速度？
2.1K20发布于 2019-11-20

[oeasy]python0096_游戏娱乐行业_雅达利_米洛华_四人赛马_影视结合游戏

人工智能学术速递[6.24]

深度强化学习的加速方法

【重磅】深度强化学习的加速方法

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐