首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >RNNs的状态归一化

RNNs的状态归一化
EN

Stack Overflow用户
提问于 2016-02-10 18:22:27
回答 1查看 91关注 0票数 1

也许更好地向计算机科学或交叉验证提出一个问题?

我正在开始一些关于任意长度序列的LSTM工作,这是我正在经历的一个问题,我还没有看到解决的问题,就是我的网络似乎开发了几个线性增长的参数(也许是作为时间的度量?)

这方面的明显问题是,训练数据被限制在长度为x的序列上,因此网络会合理地将这个参数增长到直到x。但在那之后,网络最终会产生南,因为价值观变得太极端了。

有没有人读过任何关于随着时间的推移国家稳定正常化的文章?

如有任何建议,将不胜感激。

EN

回答 1

Stack Overflow用户

发布于 2016-08-31 22:09:51

想法1:梯度裁剪通常应用于RNN中。下面是实现的一个示例:如何在张量流中有效地应用梯度剪裁?

想法2:使用经常性批处理规范化(arXiv) (批归一化)

下面是批量规范化的LSTM单元的Tensorflow实现:https://github.com/OlavHN/bnlstm/blob/master/lstm.py

这个实现在本文中解释:用于Tensorflow的批量归一化LSTM

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/35323023

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档