我们知道tf.multiply可以像这样广播:
import tensorflow as tf
import numpy as np
a = tf.Variable(np.arange(12).reshape(3, 4))
b = tf.Variable(np.arange(4))
sess = tf.InteractiveSession()
sess.run(tf.global_variables_initializer())
sess.run(tf.multiply(a, b))这会给我们
[[0, 1, 4, 9],
[0, 5, 12, 21],
[0, 9, 20, 33]]但我的问题是,如果a和b都是分批的,我该怎么办?那是,
a = tf.Variable(np.arange(24).reshape(2, 3, 4))
b = tf.Variable(np.arange(8).reshape(2, 4))那么,如何才能得到将向量乘(广播)到每批矩阵的结果呢?如下所示:
[[[0, 1, 4, 9],
[0, 5, 12, 21],
[0, 9, 20, 33]],
[[48, 65, 84, 105],
[64, 85, 108, 133],
[80, 105, 132, 161]]]谢谢!
发布于 2017-01-11 16:04:50
广播首先向左边添加单点维数,直到秩匹配。在第一种情况下,添加批处理维度。但在第二种情况下,您已经有了批处理维度,因此需要在第二个位置手动插入单例维度:
a = tf.reshape(tf.range(24), (2, 3, 4))
b = tf.reshape(tf.range(8), (2, 4))
sess.run(tf.mul(a, tf.expand_dims(b, 1)))https://stackoverflow.com/questions/41592537
复制相似问题