首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏杰的记事本

    ES6中的Proxy和Reflect

    name: "obj-1", foo() { console.log( "obj1.foo:", this.name ); } }, obj2 = { name: "obj

    70420发布于 2019-09-04
  • 来自专栏python3

    Python协程中使用上下文

    in outer request-9 from obj_ref_dict obj-0: <A|x: 0> in obj_ref_dict obj-1: <A|x: 1> in obj_ref_dict obj : None in outer request-9 from obj_ref_dict obj-0: None in obj_ref_dict obj-1: None in obj_ref_dict obj

    1.6K30发布于 2020-01-19
  • 来自专栏机器之心

    如何优化测试时计算?解决「元强化学习」问题

    可以通过多轮强化学习方法来解决 (Obj-1) 和 (Obj-2)。

    19410编辑于 2025-02-10
  • 来自专栏新智元

    28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理

    可以通过多轮RL方法解决(Obj-1)和(Obj-2),例如基于策略梯度的中间密集奖励方法,或者基于演员-评论家(actor-critic)架构的方法(例如,先前的ArCHer工作)。

    23310编辑于 2025-02-04
领券