搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

策略优化是否学习策略以更高的概率做出更好的行动？

当我谈到策略优化时，它会被引用到下面的图片，并且它被链接到DFO/进化论加上策略梯度。我想知道这样的说法是否正确:策略优化学习策略，以更高的概率做出更好的行动？另外，最大化策略优化在图片中的位置是什么？

浏览 0修改于2018-11-13得票数 1

回答已采纳

1回答

如何使行李员-福特在最坏的情况下运行？

我试图使优化版本的贝尔福特算法在最坏的情况下运行。优化版本我的意思是，如果放松1轮边缘，没有进一步更新的最短距离，它终止。例如，一个具有7个顶点的简单连通加权有向图，从源顶点0运行优化的Bellman算法需要至少5轮才能得到正确的最短路径。该图表不能包含负重循环。但是，我不太确定的策略，在绘制图表，以满足要求。

浏览 2修改于2019-11-06得票数 0

1回答

actor-critic模型中的共享参数是如何工作的？

在听Berkeley大学的策略梯度方法类时，在讲座中提到，在使用一些策略参数优化策略和使用一些值函数参数优化值函数的actor-critic算法中，在一些算法(例如A2C/A3C)中，我们在两个优化问题中使用相同的参数(即策略参数=值函数参数)。我在想，我们应该分别优化它们。这个共享参数解决方案对我们有什么帮助？提前感谢:)

浏览 80提问于2019-05-26得票数 1

回答已采纳

3回答

SQL优化策略

我想在我的数据库优化策略中使用索引和查询优化。问题是我如何证明我的策略有所改进？我的演讲谈到了查询优化，我可以通过计算来证明，谁有更多的想法？要计算什么？那索引呢，我需要证据来证明。怎么做？

浏览 1提问于2011-05-09得票数 0

1回答

如何在ppc上选择缓存写入策略

我正在优化PowerPC MPC83xx上的Linux启动。我正在尝试优化内核映像复制，从nand到ram，并尝试检查或更改缓存的写入策略。谢谢！

浏览 1修改于2010-07-01得票数 2

2回答

基于Robert的算法交易的鲁棒测度

我正在优化算法策略。在从多个优化策略库中进行选择的过程中，我正处于搜索(评估)策略鲁棒性的阶段。根据Pardo博士在第231页的“贸易战略评估”一书中的指导方针，Pardo博士在数字3中对优化的数据适用以下比率：问题:从优化结果来看c.)每个模拟的平均净利润减去它的标准差的关系尽管这句话看起来“很简单”，但我真的很想理解帕多所说的话是什么意思，以及如何计算它，以便筛选出最稳健的算法策略

浏览 5修改于2017-11-06得票数 1

1回答

在MySQL中结合使用GenerationType.SEQUENCE和Hibernate是个好主意吗？

我读到Hibernate在实体创建时强制执行额外的查询，即使在使用标识策略时也是如此，因此在MySQL上扼杀了一些优化，这些优化使Hibernate比“模拟”序列策略更可取。

浏览 1修改于2019-11-25得票数 0

1回答

NoSQL优化策略

查找关于以下内容的一些输入。希望这对版主来说不会太主观。如果一个移动应用程序要有一个Group对象和一个用户，其中一个用户可以属于许多组，而一个组有很多用户(多到多的关系)，我可以用我正在考虑的两种方法来设计这几种方法：Users [{ groups : {1,2,3,4} id: 1,}]b) id: 1 id: 1

浏览 4修改于2017-09-22得票数 0

回答已采纳

1回答

MySQL优化-成本计划器不知道何时DuplicateWeedout策略创建磁盘表

from table3)order by table1.id 检查上述查询的优化器跟踪优化跟踪成本由于复制-WEEDOUT成本较低，mysql对上述查询采用了复制-WEEDOUT策略.优化器跟踪不计算连接优化部分中磁盘表的成本。如果计算了磁盘表成本，则它将高于第一次匹配。那么final_semijoin_

浏览 2修改于2020-12-14得票数 6

1回答

加入策略到底是什么？

我目前正在阅读查询优化器是如何工作的，我经常遇到短语“联接策略”，并且查询优化器将它包含在成本计算中。当我们讨论具有多个联接的查询的连接策略时，这到底是如何工作的呢？加入策略真的会改变订单吗？这不会影响结果吗？

浏览 2提问于2017-08-01得票数 0

回答已采纳

1回答

连续强化学习优化

我正在实现连续强化学习(用深度强化学习的连续控制)，但在优化策略-神经网络时遇到了一些问题。按照本文的建议，通过计算和跟踪梯度(梯度上升)，使策略的q值最大化:最大Q(状态，action=policy(状态))。当行动->无限时，Q->无穷大，这意味着策略的权重被优化到非常大或无限大的值。我计划将策略的输出限制在0,1，而不是线性输出层，但这似乎严重阻碍了优化过程，而且算法无法再学习好的策略。

浏览 1提问于2017-04-29得票数 2

1回答

我在上读了Hibernate教程，得到了在select或Join中哪个获取策略更好的问题，我们应该继续研究。以下是我的理解:- 惰性/选择获取策略：-选择获取策略是关联的延迟获取。延迟策略的目的是内存优化。当我说到内存优化时，这意味着它避免了堆错误。我就是这么想的。因此，我们可以说是的，如果我们正在加载太多的对象，我们应该采用延迟获取策略，但是就时间性能而言，它并没有提供任何好处。同意吗？the / Join策略：- Join<em

浏览 1修改于2011-11-08得票数 1

回答已采纳

1回答

Akka Actor:路径查找效率

当设备上线时，我通过向参与者的路径发送和标识消息来“按需”创建它们，然后如果它还不存在，我就创建一个。潜在地，可能会有数百万台这样的设备。我担心的是，随着参与者数量的增加，标识查找将会影响性能。我正在考虑使用路由器策略来对参与者进行分段，但后来我发现，使用路由器的通配符在路径上进行搜索会得到来自每个路由器的ActorIdentities。我假设ConsistentHashingRouter将适合这种情况，但在我进入那个兔子洞之前，我只想确保我没有过早地进行优化。

浏览 2修改于2013-10-02得票数 2

2回答

为什么策略梯度定理在强化学习中使用Q函数？

策略梯度算法的引入表明，策略算法是更好的算法，因为它直接优化策略，而不需要先计算Q。那么为什么他们在等式中使用Q呢？他们如何在不先计算Q函数的情况下直接计算整个东西？

浏览 5提问于2019-09-20得票数 1

3回答

Visual studio中的c++编译器优化技术有哪些

我想知道编译器优化策略，以便在Visual studio中为我的c++应用程序生成优化的目标代码。目前我使用的是默认设置。

浏览 0提问于2010-08-22得票数 7

回答已采纳

2回答

调用服务处理大型文件

我有两个选择来优化它，这样它就不用占用那么多内存了：来回传递UNC文件路径。看起来很有希望，但事情复杂，因为有人需要清理文件后，使用。哪一种选择在优化资源使用(内存、网络、文件系统)方面取得最佳效果？

浏览 3提问于2013-01-14得票数 1

1回答

策略优化在基于模型的RL中的作用

在给定M_{sim}时，我使用一个代理A (即使用PPO，这是一种策略优化方法)来为某些奖励项R找到最优策略\pi^* w.r.t。虽然我确实得到了一些好的结果(能够随着时间的推移而增加回报)，但我突然想到，我实际上是在混合来自不同世界的方法--如果给出了M_{sim}，那么我们正在处理基于模型的RL，如果是这样，那么使用策略优化是如何合理的至少在分类学方面，如果A的学习过程发生在M_{real}上就更合理了，因为这被认为是无模型的，但是当使用M_{sim}时，只使用无模型方法使用策略<

浏览 0提问于2022-10-24得票数 0

1回答

使用内存优化更快的SQL临时表和表变量

中的场景C描述了如何用内存优化表替换连接范围内的临时表。该方案使用筛选器安全策略，该策略调用一个函数来确定@@spid是否与内存优化表中的SpidFilter列匹配。这是否适用于.NET连接池？NET通过调用sp_reset_connection清除会话作用域的临时表，但这不会清除内存优化表，也不会更改@@spid。

浏览 0修改于2018-06-16得票数 1

回答已采纳

1回答

tensorflow代码优化策略

从对gpu编程知之甚少的人的角度来看，我想知道什么指南或策略将是优化我的代码的“好起点”。(单一gpu) 也许每次花在每个tensorflow上的时间会很好.

浏览 1提问于2016-06-10得票数 9

回答已采纳

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

策略优化是否学习策略以更高的概率做出更好的行动？

如何使行李员-福特在最坏的情况下运行？

actor-critic模型中的共享参数是如何工作的？

SQL优化策略

如何在ppc上选择缓存写入策略

基于Robert的算法交易的鲁棒测度

在MySQL中结合使用GenerationType.SEQUENCE和Hibernate是个好主意吗？

优化javascript策略

NoSQL优化策略

MySQL优化-成本计划器不知道何时DuplicateWeedout策略创建磁盘表

加入策略到底是什么？

连续强化学习优化

hibernate中的延迟取取策略与急切取取策略？

Akka Actor:路径查找效率

为什么策略梯度定理在强化学习中使用Q函数？

Visual studio中的c++编译器优化技术有哪些

调用服务处理大型文件

策略优化在基于模型的RL中的作用

使用内存优化更快的SQL临时表和表变量

tensorflow代码优化策略

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐