我正在使用Windows-Machine-Learning将我的VideoFrame转换为TensorFloat _input (形状: 1,3,256,192;RGB通道+图像),将其加载到我的onnx模型中,并作为_output接收另一个TensorFloat对象(形状: 1, 17 ,64,48;17个检测到的对象+图像)。
现在我的问题是:如果我想访问TensorFloat _output,目前我知道的唯一方法是使用_output.data.GetAsVectorView,它给了我一个很长的1d矢量,并尝试对其进行重新排序,并找出其中的维度是如何排序的?有没有一个明确的规则可以让我理解4D张量是如何在1D Vector中编码的?或者,我可以通过某种方式直接从_output TensorFloat对象访问不同的维度,因为使用"Shape“可以显示它是一个多维数组?
发布于 2021-06-08 00:19:04
请参考此处的Windows ML张量布局:
https://docs.microsoft.com/en-us/uwp/api/windows.ai.machinelearning.tensorfloat?view=winrt-20348
张量是一个多维数组的值。浮点张量是32位浮点值的张量。
张量的布局是以行为主的,紧凑的连续数据表示每个维度。张量的总大小是每个维度大小的乘积。
考虑一下:
Shape: [D1][D2][D3]...[DN]
Strides: [S1][S2][S3]...[SN]
Location: [A1][A2][A3]...[AN], 并且您希望计算位置的索引。
然后,您可以假设:
Sn = Dn+1 * Dn+2 * ... * Dn, (for n = 1...N-1)
SN = 1所以:
index = A1*S1 + A2*S2 + A3*S3 + ... + AN*SNhttps://stackoverflow.com/questions/67745316
复制相似问题