首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于强化学习的神经网络输出约束的最佳方法

基于强化学习的神经网络输出约束的最佳方法
EN

Stack Overflow用户
提问于 2018-08-05 10:44:04
回答 1查看 913关注 0票数 1

我正在训练一个神经网络(前馈,Tanh隐藏层),它接收状态作为输入,并将动作作为输出。我遵循策略梯度强化学习的强化算法.

然而,我需要我的控制行动是有限度的(假设从0-5)。目前,我这样做的方法是使用乙状结肠输出函数并将输出乘以5。虽然我的算法性能中等,但我发现对输出使用这种“边界方案”存在以下缺点:

我知道回归(因此我猜是强化学习)线性输出是最好的,虽然乙状结肠有一个线性部分,我担心网络无法正确地捕捉到这种线性输出行为,或者它捕捉它的速度太慢(因为它的最佳性能是用于分类,因此使输出极化)。

我想知道还有什么其他的选择,也许还有一些启发。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-08-05 10:50:34

你考虑过使用nn.ReLU6()吗?这是经过校正的线性单元的有界版本,其输出定义为

代码语言:javascript
复制
out = min( max(x, 0), 6)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51693567

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档