腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
策略
优化
是否学习
策略
以更高的概率做出更好的行动?
当我谈到
策略
优化
时,它会被引用到下面的图片,并且它被链接到DFO/进化论加上
策略
梯度。我想知道这样的说法是否正确:
策略
优化
学习
策略
,以更高的概率做出更好的行动?另外,最大化
策略
优化
在图片中的位置是什么?
浏览 0
修改于2018-11-13
得票数 1
回答已采纳
1
回答
如何使行李员-福特在最坏的情况下运行?
我试图使
优化
版本的贝尔福特算法在最坏的情况下运行。
优化
版本我的意思是,如果放松1轮边缘,没有进一步更新的最短距离,它终止。例如,一个具有7个顶点的简单连通加权有向图,从源顶点0运行
优化
的Bellman算法需要至少5轮才能得到正确的最短
路径
。 该图表不能包含负重循环。但是,我不太确定的
策略
,在绘制图表,以满足要求。
浏览 2
修改于2019-11-06
得票数 0
1
回答
actor-critic模型中的共享参数是如何工作的?
在听Berkeley大学的
策略
梯度方法类时,在讲座中提到,在使用一些
策略
参数
优化
策略
和使用一些值函数参数
优化
值函数的actor-critic算法中,在一些算法(例如A2C/A3C)中,我们在两个
优化
问题中使用相同的参数(即
策略
参数=值函数参数)。我在想,我们应该分别
优化
它们。这个共享参数解决方案对我们有什么帮助? 提前感谢:)
浏览 80
提问于2019-05-26
得票数 1
回答已采纳
3
回答
SQL
优化
策略
我想在我的数据库
优化
策略
中使用索引和查询
优化
。问题是我如何证明我的
策略
有所改进?我的演讲谈到了查询
优化
,我可以通过计算来证明,谁有更多的想法?要计算什么?那索引呢,我需要证据来证明。怎么做?
浏览 1
提问于2011-05-09
得票数 0
1
回答
如何在ppc上选择缓存写入
策略
我正在
优化
PowerPC MPC83xx上的Linux启动。我正在尝试
优化
内核映像复制,从nand到ram,并尝试检查或更改缓存的写入
策略
。谢谢!
浏览 1
修改于2010-07-01
得票数 2
2
回答
基于Robert的算法交易的鲁棒测度
我正在
优化
算法
策略
。在从多个
优化
策略
库中进行选择的过程中,我正处于搜索(评估)
策略
鲁棒性的阶段。根据Pardo博士在第231页的“贸易战略评估”一书中的指导方针,Pardo博士在数字3中对
优化
的数据适用以下比率:问题:从
优化
结果来看c.)每个模拟的平均净利润减去它的标准差的关系 尽管这句话看起来“很简单”,但我真的很想理解帕多所说的话是什么意思,以及如何计算它,以便筛选出最稳健的算法
策略
浏览 5
修改于2017-11-06
得票数 1
1
回答
在MySQL中结合使用GenerationType.SEQUENCE和Hibernate是个好主意吗?
我读到Hibernate在实体创建时强制执行额外的查询,即使在使用标识
策略
时也是如此,因此在MySQL上扼杀了一些
优化
,这些
优化
使Hibernate比“模拟”序列
策略
更可取。
浏览 1
修改于2019-11-25
得票数 0
1
回答
优化
javascript
策略
以下是
策略
: 谢谢!
浏览 0
提问于2018-03-06
得票数 0
回答已采纳
1
回答
NoSQL
优化
策略
查找关于以下内容的一些输入。希望这对版主来说不会太主观。如果一个移动应用程序要有一个Group对象和一个用户,其中一个用户可以属于许多组,而一个组有很多用户(多到多的关系),我可以用我正在考虑的两种方法来设计这几种方法:Users [{ groups : {1,2,3,4} id: 1,}]b) id: 1 id: 1
浏览 4
修改于2017-09-22
得票数 0
回答已采纳
1
回答
MySQL
优化
-成本计划器不知道何时DuplicateWeedout
策略
创建磁盘表
from table3)order by table1.id 检查上述查询的
优化
器跟踪
优化
跟踪成本由于复制-WEEDOUT成本较低,mysql对上述查询采用了复制-WEEDOUT
策略
.
优化
器跟踪不计算连接
优化
部分中磁盘表的成本。如果计算了磁盘表成本,则它将高于第一次匹配。那么final_semijoin_
浏览 2
修改于2020-12-14
得票数 6
1
回答
加入
策略
到底是什么?
我目前正在阅读查询
优化
器是如何工作的,我经常遇到短语“联接
策略
”,并且查询
优化
器将它包含在成本计算中。当我们讨论具有多个联接的查询的连接
策略
时,这到底是如何工作的呢?加入
策略
真的会改变订单吗?这不会影响结果吗?
浏览 2
提问于2017-08-01
得票数 0
回答已采纳
1
回答
连续强化学习
优化
我正在实现连续强化学习(用深度强化学习的连续控制),但在
优化
策略
-神经网络时遇到了一些问题。按照本文的建议,通过计算和跟踪梯度(梯度上升),使
策略
的q值最大化:最大Q(状态,action=policy(状态))。当行动->无限时,Q->无穷大,这意味着
策略
的权重被
优化
到非常大或无限大的值。我计划将
策略
的输出限制在0,1,而不是线性输出层,但这似乎严重阻碍了
优化
过程,而且算法无法再学习好的
策略
。
浏览 1
提问于2017-04-29
得票数 2
1
回答
hibernate中的延迟取取
策略
与急切取取
策略
?
我在上读了Hibernate教程,得到了在select或Join中哪个获取
策略
更好的问题,我们应该继续研究。以下是我的理解:- 惰性/选择获取
策略
:-选择获取
策略
是关联的延迟获取。延迟
策略
的目的是内存
优化
。当我说到内存
优化
时,这意味着它避免了堆错误。我就是这么想的。因此,我们可以说是的,如果我们正在加载太多的对象,我们应该采用延迟获取
策略
,但是就时间性能而言,它并没有提供任何好处。同意吗?the / Join
策略
:- Join<em
浏览 1
修改于2011-11-08
得票数 1
回答已采纳
1
回答
Akka Actor:
路径
查找效率
当设备上线时,我通过向参与者的
路径
发送和标识消息来“按需”创建它们,然后如果它还不存在,我就创建一个。潜在地,可能会有数百万台这样的设备。 我担心的是,随着参与者数量的增加,标识查找将会影响性能。我正在考虑使用路由器
策略
来对参与者进行分段,但后来我发现,使用路由器的通配符在
路径
上进行搜索会得到来自每个路由器的ActorIdentities。我假设ConsistentHashingRouter将适合这种情况,但在我进入那个兔子洞之前,我只想确保我没有过早地进行
优化
。
浏览 2
修改于2013-10-02
得票数 2
2
回答
为什么
策略
梯度定理在强化学习中使用Q函数?
策略
梯度算法的引入表明,
策略
算法是更好的算法,因为它直接
优化
策略
,而不需要先计算Q。那么为什么他们在等式中使用Q呢?他们如何在不先计算Q函数的情况下直接计算整个东西?
浏览 5
提问于2019-09-20
得票数 1
3
回答
Visual studio中的c++编译器
优化
技术有哪些
我想知道编译器
优化
策略
,以便在Visual studio中为我的c++应用程序生成
优化
的目标代码。目前我使用的是默认设置。
浏览 0
提问于2010-08-22
得票数 7
回答已采纳
2
回答
调用服务处理大型文件
我有两个选择来
优化
它,这样它就不用占用那么多内存了: 来回传递UNC文件
路径
。看起来很有希望,但事情复杂,因为有人需要清理文件后,使用。哪一种选择在
优化
资源使用(内存、网络、文件系统)方面取得最佳效果?
浏览 3
提问于2013-01-14
得票数 1
1
回答
策略
优化
在基于模型的RL中的作用
在给定M_{sim}时,我使用一个代理A (即使用PPO,这是一种
策略
优化
方法)来为某些奖励项R找到最优
策略
\pi^* w.r.t。虽然我确实得到了一些好的结果(能够随着时间的推移而增加回报),但我突然想到,我实际上是在混合来自不同世界的方法--如果给出了M_{sim},那么我们正在处理基于模型的RL,如果是这样,那么使用
策略
优化
是如何合理的至少在分类学方面,如果A的学习过程发生在M_{real}上就更合理了,因为这被认为是无模型的,但是当使用M_{sim}时,只使用无模型方法使用
策略
<
浏览 0
提问于2022-10-24
得票数 0
1
回答
使用内存
优化
更快的SQL临时表和表变量
中的场景C描述了如何用内存
优化
表替换连接范围内的临时表。该方案使用筛选器安全
策略
,该
策略
调用一个函数来确定@@spid是否与内存
优化
表中的SpidFilter列匹配。 这是否适用于.NET连接池?NET通过调用sp_reset_connection清除会话作用域的临时表,但这不会清除内存
优化
表,也不会更改@@spid。
浏览 0
修改于2018-06-16
得票数 1
回答已采纳
1
回答
tensorflow代码
优化
策略
从对gpu编程知之甚少的人的角度来看,我想知道什么指南或
策略
将是
优化
我的代码的“好起点”。(单一gpu) 也许每次花在每个tensorflow上的时间会很好.
浏览 1
提问于2016-06-10
得票数 9
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券