文章/答案/技术大牛

发布

问了解GRU架构- Keras
EN

Stack Overflow用户

提问于 2019-03-20 21:11:48

回答 1查看 1.4K关注 0票数 4

我正在使用Mycroft AI唤醒词检测，并试图了解网络的维度。以下各行显示了Keras中的模型：

model = Sequential()
model.add(GRU(
        params.recurrent_units, activation='linear',
        input_shape=(pr.n_features, pr.feature_size), dropout=params.dropout, name='net'))
model.add(Dense(1, activation='sigmoid'))

我的特征大小是29*13。GRU层有20个单元。我的问题是，我的模型如何在GRU层中有2040个可学习参数？这些单元是如何连接的？也许我对GRU网络的整体理解是错误的，但我只能找到对单个单元的解释，而不能找到对整个网络的解释。GRU网络是否完全连接？谢谢!

Network Architecture

recurrent-neural-network

gated-recurrent-unit

keras

neural-network

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-03-20 21:59:59

首先，对于一般的RNN，时间维度可以是任意的。对于您的情况，这意味着数字29不起作用。数字2040完全由数字13 (特征)和20 (GRU中的单位)组成。

要理解这个数字是从哪里来的，请看一下来自wikipedia的这张图片

这就是基本GRU单元的外观。要了解变量的维度，请看同一篇维基百科文章中的公式：

为了理解这一点，您只需要知道输入向量 x[t]在您的情况下具有维度 13，并且内部状态和输出 h[t], r[t], z[t], y[t]的维度为 20。如您所见，有几个地方使用了维度参数。所以，我个人不喜欢用“单位”这个词来形容它，因为它暗示里面有 20 个“东西”。事实上，它只是内部状态、矩阵和偏差的维度：

有了这个知识，并且知道公式中的维数必须匹配，您可以推导出W矩阵必须具有维度20 x 13，U矩阵必须具有维度20 x 20。biases b必须具有尺寸20。

然后，参数的总数计算为

#Params = 3 * dim(W)
        + 3 * dim(U)
        + 3 * dim(b)
        = 3 * 20*13 + 3 * 20*20 + 3 * 20
        = 2040

为了更深入地理解RNN在Keras中是如何工作的，我强烈推荐this question的答案。它说它是关于LSTM的，但上面说的一切也适用于GRUs。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/55261557

复制

相似问题

问了解GRU架构- Keras
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问了解GRU架构- KerasEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问了解GRU架构- Keras
EN