背景
在阅读tensorflow的文档时,我在变量共享.The示例中遇到了卷积神经网络的例子,它描述了一个将两幅图像暴露在图像过滤器中以重用变量的问题,从而激发了变量共享的需要。
问题
我无法理解引入变量共享概念的approach.Instead --我们不能将所有图像放在一个矩阵中(以像素值的形式,每一行表示一幅新的图像),并通过使用单一的variables.The方法对整个矩阵执行必要的操作,比如过滤器,我建议使用类似于我们在香草神经networks.We中使用的方法,不要对每个训练示例使用重用变量的概念,而是将它们以矩阵的形式堆叠起来,并为所有的训练示例建立一个共同的权重矩阵来执行必要的操作。
有人能指出我在这两种方法之间建立一致性的错误是什么吗?
发布于 2017-01-31 10:48:51
在前传中,您无法区分共享变量和两个相同变量。但是在训练中,回传是不同的。如果你有两个相同的变量,你会有两个调整,它们一般都不是相同的,所以这两个变量会发散。如果只有一个共享变量,则只有一个调整。
https://stackoverflow.com/questions/41954468
复制相似问题