“叠加LSTM隐藏层可以使模型更深入，更准确地将其描述为一种深度学习技术……附加的隐藏层被理解为重新组合了以前层的学习表示，并在高抽象级别上创建了新的表示形式。例如，从线条到形状到对象……足够大的单层多层Perceptron可以用来近似大多数功能。增加网络的深度提供了另一种解决方案，需要更少的神经元和更快的训练。最终，增加深度是一种代表性优化。”

在神经网络中增加层/隐单元的数量并不一定会导致过度拟合。太少会导致低训练和测试准确性；太多将导致高训练精度，但测试精度低(过度拟合)。在中间的某个地方，会有适当数量的隐藏层和单位来解决这个问题。一些复杂的问题，如NLP，需要许多堆叠隐藏的LSTM层http://ruder.io/deep-learning-nlp-best-practices/。

这个线程可能有用：https://ai.stackexchange.com/questions/3156/how-to-select-number-of-hidden-layers-and-number-of-memory-cells-in-an-lstm

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/47969

复制

相似问题

问使用堆叠式LSTM总是比单一LSTM好吗？
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用堆叠式LSTM总是比单一LSTM好吗？EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用堆叠式LSTM总是比单一LSTM好吗？
EN