2D-3D交叉注意力结构凭77.50% Rank-1、89.64% Rank-2、94.85% Rank-3全面碾压单模特征,3D-only仅33.21% Rank-1。 软标签替硬标签带来2.86% Rank-1、7.5% Rank-2、8.43% Rank-3的绝对跃升,mAP再涨5.93个百分点。
For example, if we wanted to insert two slices in the first dimension of a rank-3 tensor with two matrices
描述这样的张量最常见的方式是称之为rank-3 张量。我们经常需要将集合中的单个张量堆叠成一个张量。不出所料,PyTorch 带有一个名为stack的函数,我们可以用它来实现这个目的。 我们通过沿着我们堆叠的 rank-3 张量的维度 0 取平均值来计算所有图像张量的平均值。这是索引所有图像的维度。 换句话说,对于每个像素位置,这将计算所有图像中该像素的平均值。