首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏奇点大数据

    OpenAI发布强化学习环境Gym Retro:支持千种游戏

    项目链接:https://github.com/openai/retro/tree/develop OpenAI 近日发布了完整版游戏强化学习研究平台——Gym Retro。 Gym Retro 可以帮助研究在概念相似但外观不同的游戏之间进行泛化的能力。 正在进行的 Retro Contest(几周后结束!) 他们还希望 Retro Contest 参与者开发的一些解决方案能够得到扩展并应用到整个 Gym Retro 数据集。 集成工具 ? OpenAI 还将发布用于集成新游戏的工具。 原文链接:https://blog.openai.com/gym-retro/

    78930发布于 2018-07-24
  • 来自专栏机器之心

    资源 | OpenAI发布强化学习环境Gym Retro:支持千种游戏

    项目链接:https://github.com/openai/retro/tree/develop OpenAI 近日发布了完整版游戏强化学习研究平台——Gym Retro。 Gym Retro 可以帮助研究在概念相似但外观不同的游戏之间进行泛化的能力。 正在进行的 Retro Contest(几周后结束!) 他们还希望 Retro Contest 参与者开发的一些解决方案能够得到扩展并应用到整个 Gym Retro 数据集。 集成工具 ? OpenAI 还将发布用于集成新游戏的工具。 Gym Retro 数据集中的许多游戏都是稀疏奖励或需要计划的,因此,处理整个数据集中的内容可能需要开发者找到全新技术。

    63850发布于 2018-06-12
  • 来自专栏目标检测和深度学习

    资源 | OpenAI发布强化学习环境Gym Retro:支持千种游戏

    项目链接:https://github.com/openai/retro/tree/develop OpenAI 近日发布了完整版游戏强化学习研究平台——Gym Retro。 Gym Retro 可以帮助研究在概念相似但外观不同的游戏之间进行泛化的能力。 正在进行的 Retro Contest(几周后结束!) 他们还希望 Retro Contest 参与者开发的一些解决方案能够得到扩展并应用到整个 Gym Retro 数据集。 集成工具 ? OpenAI 还将发布用于集成新游戏的工具。 Gym Retro 数据集中的许多游戏都是稀疏奖励或需要计划的,因此,处理整个数据集中的内容可能需要开发者找到全新技术。

    76320发布于 2018-07-23
  • 来自专栏DrugOne

    ICML2020 | Retro*: 通过神经引导的A*搜索学习逆合成设计

    在500个单步调用的时间限制下,Retro*比第二好的方法DFPN-E解决的测试分子多31%。Retro*提供的所有解决方案中,有50条比专家路线短,而有112条在总成本方面更好。 作者还进行了消融研究,以通过评估非学习版本Retro*-0来了解Retro*中学习组件的重要性。 与基线方法相比,Retro*-0也显示出有希望的结果,然而就成功率而言,Retro*表现优于6%,这表明从先前的规划经验中学习带来的性能提升。 ? 就总成本而言,Retro*比第二好的方法产生的最佳路线多4倍。即使对于长度度量,这也不是Retro*选择的目标,它仍然可以获得与最佳方法大致相同的性能。 4 结论 在这项工作中,作者提出了Retro*,这是一种基于学习的逆向合成设计算法,可以有效地找到高质量的路线。Retro*能够利用以前的设计经验,将对看不见的分子的搜索偏向有希望的方向。

    1K50发布于 2021-02-01
  • 来自专栏AI研习社

    OpenAI 发布完整版游戏强化学习研究平台 Gym Retro

    我们使用 Gym Retro 来研究增强学习算法和泛化。RL 之前的研究主要集中在优化 Agent 解决单个任务上。 通过 Gym Retro,我们可以研究内部概念相似但外观表现不同的游戏之间泛化的能力。 ? 我们也希望由 Retro 竞赛参与者开发的一些解决方案可以扩展并应用于完整的 Gym Retro 数据集上。 集成工具 ? Gym Retro 数据集中的许多游戏都有稀疏的奖励或需要规划策略,因此处理完整数据集可能需要尚未开发的新技术。 Gym Retro Github: https://github.com/openai/retro 原文链接: https://blog.openai.com/gym-retro/

    81930发布于 2018-07-26
  • 来自专栏ThoughtWorks

    用归零的心态,做好团队回顾

    Retro 是敏捷软件开发方法中的回顾,Retro 这个单词的全称是 Retrospective。 这就是 Retro 的魅力, Retro 本身只是一种形式,但是提供了一种持续改进的方法。 当然,Retro 也不一定限于这三个方面,也有一些其他的 Retro 形式。 对于更多的 Retro 模型,你可以在 funretrospectives.com 的网站上找到类似更多的Retro形式。不过需要注意的是,Retro 的形式是一种套路,而非 Retro 本身。 让 Retro 更有效 Retro 只是一种会议形式,其成效取决于会议的主持人和参与者,有一些注意事项给到大家,避免 Retro 流于形式。 坚持 Retro 很重要的一个点是持续坚持,如果只做一次 Retro 实际上意义不大。如果一个团队定期都会举行 Retro,那么团队成员就会时刻准备下一次 Retro 可以讨论的问题。

    64530编辑于 2022-03-18
  • 来自专栏机器之心

    业界 | OpenAI举办迁移学习竞赛:评估强化学习算法表现

    竞赛地址:https://contest.openai.com/ Gym Retro 的 GitHub 地址:https://github.com/openai/retro ? retro-baseline 地址:https://github.com/openai/retro-baselines ? Gym Retro 测试版 OpenAI 于今天发布 Gym Retro,这是一个将经典视频游戏封装作为强化学习环境的系统。 Gym Retro 由「Retro Learning Environment」所启发,但相比之下更加灵活;例如,在 Gym Retro 中,你可以通过 JSON 文件而不是 C++代码指定环境定义,因而能更好地整合新的游戏 Gym Retro 是 OpenAI 第二次尝试建立强化学习环境的大型数据集。

    86050发布于 2018-05-08
  • 像素艺术生成模型现已上线

    Retro Diffusion的像素艺术模型现已上线Retro Diffusion精心打造了一套用于创建游戏资源、角色精灵、贴图和其他精美复古图形的模型和风格。 Retro Diffusion在Replicate上拥有四个模型:rd-fast: 一个专门用于快速生成像素艺术图像的网址链接。rd-plus: 一个用于生成高质量、逼真像素艺术图像的网址链接。 rd-fast: 快速像素艺术图像生成retro-diffusion/rd-fast 针对速度进行了优化,支持15种风格,从肖像到某风格物品。 import replicateoutput = replicate.run( "retro-diffusion/rd-fast", input={ "prompt": "knight character, retro game asset, side view", "style": "game_asset", "width": 128, "

    13610编辑于 2026-01-13
  • 来自专栏DrugOne

    ICML2021 | 自提升策略规划真实且可执行的分子逆合成路线

    (2).搜索算法策略 因Retro*及Retro*-0的优异表现,作者采用该搜索策略实现多步合成路线设计。Retro*算法模仿A*算法,基于当前路径的成本和到目标的估计成本进行最佳优先搜索。 Retro*-0是Retro*算法的变体,不依赖值函数进行扩展,而是在模型表现和一个表示值函数的额外的DNN之间进行权衡。 表1 在USPTO数据集上的模型性能对比表 表1和图5结果表明,该框架与Retro*或Retro*-0结合显著优于基线。 另外,在设计合成路径的成本和长度上,Retro*-0+OURS 和Retro*+OURS也有明显的优势。 ? 图6 Retro*-0+OURS和Retro*-0示例 4 总结 在这项工作中,作者提出了一个基于自提升模型适应的逆合成规划框架。

    78930发布于 2021-07-29
  • 来自专栏用户1880875的专栏

    让你的 Linux 终端变得酷炫复古

    如果你厌倦了你的仿真终端的外观,你需要一些酷炫的“新”东西,cool-retro-term 会给你一个复古的终端机外观,让你重温过去。你还可以改变它的颜色、动画种类,并为它添加一些效果。 Linux 中用 Snap 包安装 在 Linux 中安装 cool-retro-term 的方法有很多种。一种与发行版无关的方法是使用 Snap 软件包。 如果你的 Linux 发行版支持 Snap,你可以使用这个命令来安装 cool-retro-term: sudo snap install cool-retro-term --classic Ubuntu ppa:noobslab/apps sudo apt update sudo apt-get install cool-retro-term 在基于 Arch 的 Linux 发行版中安装 在基于 Arch 的 Linux 发行版(如 Antergos 和 Manjaro)中安装 cool-retro-term,使用以下命令: sudo pacman -S cool-retro-term

    1.1K20发布于 2021-09-15
  • 来自专栏智药邦

    Nat Commun|西北工业大学施建宇团队:通过多任务图表示学习进行单步逆合成预测

    这项研究介绍了一种革命性的方法--Retro-MTGR,该方法能够深度挖掘逆合成反应中的化学逻辑,让药物合成的逆向推理变得更加智能和精准。 Retro-MTGR:AI如何精准预测药物合成路径 施建宇教授团队提出的Retro-MTGR框架(如图1所示),是基于先进的“多任务图表示学习”的AI模型。 通过完成这三个任务,Retro-MTGR不仅帮助科学家们更好地理解化学反应机制,还能精准预测药物合成路径,为药物研发提供强大支持。 图1. 总结和展望 为了开发一个高度可解释的判别模型来揭示化学合成机制,本文提出了一个Retro-MTGR框架。 涉及两种新药的实验验证结果表明,Retro-MTGR推断的逆合成路线与化学合成测定获得的逆合成路线一致。 Retro-MTGR是一个优秀的单步逆合成推断模型。

    44710编辑于 2025-02-05
  • 来自专栏用户1880875的专栏

    让你的 Linux 终端变得酷炫复古 | Linux 中国

    Linux 中用 Snap 包安装 在 Linux 中安装 cool-retro-term 的方法有很多种。一种与发行版无关的方法是使用 Snap 软件包。 如果你的 Linux 发行版支持 Snap,你可以使用这个命令来安装 cool-retro-term: sudo snap install cool-retro-term --classic Ubuntu 的 Linux 发行版(如 Antergos 和 Manjaro)中安装 cool-retro-term,使用以下命令: sudo pacman -S cool-retro-term 从源码中安装 现在使用下面的命令来编译程序: git clone https://github.com/Swordfish90/cool-retro-term.git cd cool-retro-term qmake /cool-retro-term如果你喜欢把这个应用放在程序菜单中,以便快速访问,而不用每次都用命令手动运行它,你可以使用下面的命令: sudo cp cool-retro-term.desktop

    1.4K30发布于 2021-10-11
  • 来自专栏量子位

    OpenAI强化学习游戏库大更新:游戏上千款,还能自己加

    OpenAI今天推出的完整版Gym Retro必须了解一下。 跨游戏泛化 Gym Retro上的游戏覆盖了世嘉的创世纪和Master System,任天堂红白机(NES)、SNES和Game Boy主机。 Gym Retro里就有很多游戏属于后者,等着广大小伙伴努力攻克。 防止AI钻空子 攻克这些游戏的过程中,请注意:你的AI可能会钻空子。 让AI好好打游戏,慎重设置你的奖励函数~ 相关地址: OpenAI博客介绍:https://blog.openai.com/gym-retro/ Gym Retro:https://github.com /openai/retro/tree/develop

    1.6K50发布于 2018-07-24
  • 来自专栏新智元

    怒砸1.8亿美元,ChatGPT之父想给人类寿命续10年?

    他将Retro的事业视作一项大计划,具有「搅动人血液的魔力」,就像他曾引用过的话中所说的那般。 对于Retro未来的投资计划,Altman表示将继续「扩大规模,看看会发生什么」。 那么这个Retro公司到底是干什么的呢? 公司的CEO Joe Betts-LaCroix表示,Retro希望通过发现人体恢复活力的机制,来延长人类寿命。 这个想法又是怎样产生的呢? 与其讨论Altman的参与和1.8亿美元投资,不如将焦点放在Retro到底能做些什么上来。 人类逆转衰老的美梦能否成真? 尽管有Retro这样的公司为此目标努力,有Altman大佬的鼎力支持,逆转衰老的美梦能否实现仍未可知,让我们继续期待。 / https://retro.bio/announcement/

    40610编辑于 2023-03-29
  • 来自专栏AI科技大本营的专栏

    AI 语言模型真的是越大越好吗?这个模型优于 Gopher

    RETRO 模型 自 GPT-3 发布以后,许多其他科技公司也加入了这一潮流,开发了自己的大型语言模型并实现了类似的性能提升。 研究人员将这个较小的模型称为 RETRO,代表 Retrieval-Enhanced Transformer。 RETRO 也依赖于变压器,但它被赋予了一个重要的增强。除了根据训练预测接下来应该出现什么文本外,该模型还可以搜索包含 2 万亿个文本块的数据库,以查找使用类似语言的段落,从而改进预测。 这些模型很容易超越原始模型,甚至接近从头开始训练的 RETRO 模型的性能。 不过,重要的是要记住,按照大多数标准,RETRO 仍然是一个大型模型。它几乎是 GPT-3 的前身 GPT-2 的五倍。 人们似乎很可能希望看到更大的 RETRO 模型和更大的数据库有什么可能。 DeepMind 当然认为进一步扩展是一个很有前途的途径。

    93630编辑于 2021-12-27
  • 来自专栏何以解忧 唯有暴富

    hexo美化(Bootstrap Callout和fa图标的使用方法)

    <i class

    69920编辑于 2023-02-24
  • 来自专栏DrugOne

    逆合成规划结合经验引导的蒙特卡洛树搜索

    Retro等方法通过学习一个预测分子合成成本的评分函数来引导搜索。Retro从单步反应数据集构建多步合成路线。 需要注意的是,先前的方法,如Retro*、Retro*+以及基于强化学习的方法,使用学习到的评分函数来估计给定分子的预期合成成本或价值。 实验部分 表 1 作者对EG-MCTS进行了评估,并与基准方法在作者收集的180个分子的测试集以及Retro*和Retro*+的测试集(称为Retro*-190)进行了比较。 在作者的测试集中,EG-MCTS比次优方法Retro*+成功率高3.88%,比Retro*+少使用25.22次迭代。 结果显示,两种算法的成功率收敛到相同的值(Retro*-190为98.42%,作者的测试集为96.11%),而EG-MCTS的平均迭代次数仍然低于Retro*+。

    61520编辑于 2023-09-19
  • 来自专栏抠抠空间

    Font Awesome矢量图标框架

    /static/awesome/css/font-awesome.min.css"> 三、font awesome使用方法 基本语法 <i class="fa fa-camera-<em>retro</em> 修改图标的大小 <i class="fa fa-camera-retro fa-lg"> fa-lg fa- 2x fa-3x fa-4x fa-5x ?   修改图标的颜色 ?

    1.1K60发布于 2018-04-12
  • 来自专栏前端框架

    Font Awesome字体库使用详情

    //cdn.staticfile.org/font-awesome/4.7.0/css/font-awesome.css"></head><body> fa-lg
    fa-2x
    fa-3x
    fa-4x
    <i class="fa fa-camera-<em>retro</em>

    55200编辑于 2025-08-05
  • 来自专栏量子位

    迁移学习比赛:OpenAI喊你重温「音速小子索尼克」

    比赛用的数据集Gym Retro,是一个整合经典电动游戏到Gym的全新平台,目前已包含30个世嘉创世的游戏。 ?  为了方便大家上手,OpenAI放出了Retro的基线表现,这样大家就能get到怎么用强化算法去跑这些比赛的任务了。 ? Gym Retro的Beta版 OpenAI放出的Gym Retro是一个打包了一堆经典的电子游戏的系统,给强化学习模型提供一个环境。 Gym Retro是OpenAI团队第二次尝试搭建大型的强化学习环境数据集。 Gym Retro系统GitHub地址:https://github.com/openai/retro#gym-retro 有些时候,算法也很鸡贼。

    49010发布于 2018-07-24
领券