我对今天在我们的代码库中找到的一些代码中numpy高级切片的语义感到困惑。让我从一个例子开始:
# example boolean matrix
a = np.random.rand(5, 5) > 0.5
# Outputs
array([[ True, False, True, True, False],
[ True, True, False, True, False],
[False, True, True, True, True],
[False, False, False, False, True],
[False, True, True, False, False]])dim_1 = np.arange(5)
dim_1 = dim_1[:, None] # expand into ndarray :: (5,1)
dim_2 = np.eye(5,5).astype(int) # convert to ints so we can use as idx
a[dim_1, dim_2]
# Outputs
array([[False, True, True, True, True],
[ True, True, True, True, True],
[False, False, True, False, False],
[False, False, False, False, False],
[False, False, False, False, True]])我们在这里观察到的是,dim_2正在选择a的值。在这个例子中,我们看到眼睛上有一个:,1,剩下的条目是:,0。虽然我理解输出,但我不理解其中的语义。真正让我困惑的是第一次模糊地重塑成(5,1)。如果没有额外的维度,结果会有很大不同。我对高级切片的理解是,您可以使用高阶ndarray来索引其他ndarray,但只能从最后一个维度进行选择。要实现高阶切片,您需要分别索引每个维度,这将返回一个平面向量。
我认为这个方法很简洁,但我不了解numpy是如何解析这个切片的。有谁有什么见解吗?
发布于 2019-02-13 02:53:06
创建一个独特的数组:
In [13]: a = np.arange(25).reshape(5,5)
In [14]: dim1 = np.arange(5)[:,None]
In [15]: dim2 = np.eye(5,5).astype(int)看看这两个数组是如何相互广播的:
In [16]: np.broadcast_arrays(dim1, dim2)
Out[16]:
[array([[0, 0, 0, 0, 0],
[1, 1, 1, 1, 1],
[2, 2, 2, 2, 2],
[3, 3, 3, 3, 3],
[4, 4, 4, 4, 4]]),
array([[1, 0, 0, 0, 0],
[0, 1, 0, 0, 0],
[0, 0, 1, 0, 0],
[0, 0, 0, 1, 0],
[0, 0, 0, 0, 1]])]返回的数组在形状上与这两个数组相匹配,每个数组中的元素都是从a中选择的。
In [17]: a[dim1, dim2]
Out[17]:
array([[ 1, 0, 0, 0, 0],
[ 5, 6, 5, 5, 5],
[10, 10, 11, 10, 10],
[15, 15, 15, 16, 15],
[20, 20, 20, 20, 21]])对于由dim1索引的每一行,它根据dim2的值从第0列或第1列中挑选一个元素
In [21]: a[0, dim2[0,:]]
Out[21]: array([1, 0, 0, 0, 0])
In [22]: a[3, dim2[3,:]]
Out[22]: array([15, 15, 15, 16, 15])如果我将dim2更改为“对角线”
In [25]: dim2 = np.diag(np.arange(5))
In [26]: dim2
Out[26]:
array([[0, 0, 0, 0, 0],
[0, 1, 0, 0, 0],
[0, 0, 2, 0, 0],
[0, 0, 0, 3, 0],
[0, 0, 0, 0, 4]])
In [27]: a[dim1, dim2]
Out[27]:
array([[ 0, 0, 0, 0, 0],
[ 5, 6, 5, 5, 5],
[10, 10, 12, 10, 10],
[15, 15, 15, 18, 15],
[20, 20, 20, 20, 24]])现在大多数值都是a[:,0],但对角线是a[i,i]。
这种索引与使用一维数组进行索引没有任何不同,如
In [28]: a[np.arange(5), np.arange(5)]
Out[28]: array([ 0, 6, 12, 18, 24])
a[0,0], a[1,1], a[2,2], ...另一个例子可以通过相互广播两个数组来解释。这将选择所有图元,除了它是副本而不是视图之外,与a[:,:]相同:
In [29]: a[np.arange(5)[:,None], np.arange(5)[None,:]]
Out[29]:
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14],
[15, 16, 17, 18, 19],
[20, 21, 22, 23, 24]])https://stackoverflow.com/questions/54653954
复制相似问题