搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

当不再需要时，如何从记忆中释放张量？

我有一个假设图，它有一系列计算，如下所示：a_1 = some_op_1(a_0)a_3 = some_op_3(a_2)请注意，这与只在需要时分配内存的问题不一样。

浏览 4修改于2017-05-23得票数 2

回答已采纳

2回答

在PyTorch中，是什么使张量具有非连续的记忆？

在第二个环节中，提交人甚至声称：但是张量什么时候有不连续的记忆呢？

浏览 1提问于2019-01-08得票数 4

回答已采纳

1回答

如何在tensorflow上将3D矩阵的每一行与另一个3D矩阵的每个元素相乘？

我有两个三维张量，张量A的维数为[32,1024,128]，张量B的维数为[32,1024,1024]，其中32是批大小。对于某个样本，我想用矩阵B的每个元素乘以矩阵A的每一行，这样输出的张量维数将是[32,1024,1024,128]。我尝试使用tf.tile将两个张量转换为4D，并使用元素乘法。但这让我的记忆错误消失了。我试着将批处理大小缩小到4，但问题是相同的。如对此有任何帮助，将不胜感激。

浏览 0修改于2019-05-02得票数 2

回答已采纳

1回答

在深度强化学习中，我是计算每个迷你批次的一个损失，还是计算每个迷你批次的一个损失？

我在每个迷你批次中有300个回放记忆。我见过人们计算300个回放记忆的损失，但这对我来说并不是真的有意义。300个回放记忆来自非常不同的游戏状态，为什么将预测和目标之间的300个差异合并到一个值中是有意义的？当模型反向传播时，梯度是否被分成300个分支，每个分支对应于迷你批次中的一个条目？我的策略网络输出10个动作的概率分布，或者300 x 10张量，我的目标概率分布具有相同的形状。我想找出我的预测和目标之间的交叉熵损失。我想知道我是应该在300个大小为10的张量的预测目标对之间找到300个交叉熵损失，还

浏览 8提问于2020-05-18得票数 1

1回答

如何对张量数据的均值和标准差进行增量更新？

我有一个很大的数据集(大约400 so )，它由张量数据(shape is (600, 600, 10))组成，我想在将这个数据集输入到一个神经网络之前对它进行规范化，但是这个数据集不适合我的记忆，所以我想知道均值和标准差的增量更新公式是这里，但我不知道如何在张量情况下调整它们，因为我不是每个新的迭代步骤只有一个值，而是一个整体张量，而且我不能取这个新张量的平均值，因为平均值并不是整个数据集的平均值。

浏览 0提问于2022-09-27得票数 1

回答已采纳

1回答

当试图用py手电筒启动零张量时的内存问题

capacity; 1.50 KiB already allocated; 6.16 GiB free; 2.00 MiB reserved in total by PyTorch) 我的问题是:为什么零张量需要那么大的记忆我在另一个系统中与getsizeof核对--这个张量的大小仅显示为72字节。

浏览 0提问于2021-04-27得票数 0

回答已采纳

1回答

PyTorch:为什么运行output =model(映像)需要这么多GPU内存？

在试图理解为什么我的PyTorch模型的最大批处理大小是有限的时，我注意到使用最多内存的不是模型本身，也不是将张量加载到GPU中。当第一次生成预测时，大部分内存都会耗尽，例如训练循环中的以下一行：其中图像是一些输入张量，模型是我的PyTorch模型。那些记忆是用来做什么的？据我所知，模型已经加载，在进行调用之前，实际的输入张量已经在GPU上。输出张量本身不可能那么大。它与存储计算图表有关吗？

浏览 3提问于2022-05-27得票数 4

回答已采纳

3回答

TensorFlow:如何测量每个张量所需的GPU内存？

我想知道如何计算每个张量消耗了多少内存？默认情况下，所有张量都保存在GPU中吗？我可以简单地计算总的内存消耗的形状* 32位吗？我注意到，由于我使用动量，我所有的张量都有一个/Momentum张量。这也会占用大量的内存吗？我使用一个方法distorted_inputs来增强我的数据集，非常类似于在中定义的方法。是不是这部分占用了很大一部分记忆？我相信Darknet会在CPU中做修改。

浏览 15修改于2016-03-31得票数 13

回答已采纳

1回答

如何用NHWC数据初始化火炬NCHW通道的最后张量？

现在我有一个张量，它的内存格式和形状都是NHWC。如果我想最后将它更改为NCHW形状和通道，如下所示：它具有NCHW形状，但通道步长为1，因此不会引起记忆运动。

浏览 6提问于2022-02-16得票数 0

1回答

将内存块分配给py-火炬输出张量(C++ API)

我想指示火炬CPP库在最终输出张量中使用一个特定的内存块。这有可能吗？如果是，怎么做？下面你可以看到一个小小的例子，说明我正在努力实现的目标。() << "\n"; delete [] b;} 因此，我将内存分配到"c“中，然后从这个内存中抛出一个张量我把这个记忆存储在一个名为"out“的张量中。当我调用前向方法时，我加载模型。我观察到，得到的数据被复制/移动到&quo

浏览 5修改于2022-04-08得票数 1

1回答

如何在做两个稀疏矩阵的张量乘积后消除零点？

我想做两个稀疏矩阵的张量乘积。这绝对是对记忆的浪费，特别是在我做了多次张量积之后。在计算之后，是否有办法避免这些条目的出现或删除这些条目？非常感谢!

浏览 0提问于2019-01-30得票数 0

回答已采纳

1回答

在神经网络推理过程中，你在内存的哪一部分存储模型权重和中间值？

在tensorflow微观模型的推理过程中，我有一个关于记忆的问题。在开始时，您定义了一个tensor_arena全局变量。在这个预留空间中究竟存储了什么？也就是说，当您将一些值输入到网络输入时，这些值是否也存储在张量领域？提前感谢您的帮助

浏览 4修改于2021-12-02得票数 0

回答已采纳

1回答

如何从内存中手动删除张量？

在这个玩具示例每次迭代之后，我想从我的记忆中删除张量。我正在使用tensorflow EagerExecution。我试过用变量和简单的张量。tf.assign不做这项工作。越来越多的内存被使用。

浏览 2提问于2018-05-31得票数 3

1回答

张量运算中的内存和时间

目标，我的目标是计算由公式给出的张量，你可以在下面看到。指数i，j，k，l从0到40，p，m，x从0到80。Tensordot逼近这个求和只是收缩了6个指数的巨大张量。我试着用张量点来做，这允许这样的计算，但是我的问题是，即使我做了一个张量点，然后另一个张量点，我的问题是内存。你对解决记忆问题或缩短时间有什么想法吗？如何使用附加约束处理此类求和？

浏览 0修改于2019-01-29得票数 3

回答已采纳

2回答

由Tensorflow 2.0中的前身增加张量的每个元素

下面是问题定义我在文档(此处：)中看到，有一些方法可以度量生成的图形的大小。不过，我不知道“图”如何能有效地计算

浏览 3修改于2020-03-13得票数 7

回答已采纳

1回答

如何在PyTorch中使用LSTM进行强化学习？

由于观察不能揭示整个状态，我需要使用递归神经网络进行强化，以便网络对过去发生的事情有某种记忆。为简单起见，我们假设使用LSTM。内置的shape LSTM需要向它提供shape Time x MiniBatch x Input D的一个PyTorch输入，它输出shape Time x MiniBatch x Output D的张量

浏览 1提问于2017-10-24得票数 3

1回答

tensorflow中稠密向量与稀疏矩阵的乘法

在tensorflow中，是否有一种简单的方法来乘稀疏矩阵和稠密张量？num_vals): return vec 但我得到"TypeError：‘张量是否有一种不太需要记忆的方法来做到这一点？

浏览 0提问于2018-05-14得票数 0

回答已采纳

1回答

有没有办法在码头集装箱之间发送gpu内存中的gpu张量的位置，并在不同的容器中构建它们？

我很好奇，在GPU上分配的PyTorch张量是否有类似的方法？据我所知，CUDA张量已经在共享记忆中了。我试着通过套接字传输它们和Py火炬张量存储对象，但是它需要50到60 is左右的单程，这太慢了。为了测试目的，我只是在不同的终端上运行两个程序。是否有一种使用cudaIpcMemHandle_t或使用Pytoch函数从share_cuda()函数中提取的信息重构存储/张量的方法？还是有更好的方法来达到同样的效果？

浏览 6修改于2022-07-20得票数 1

回答已采纳

1回答

如何在Tensorflow中实现采用固定尺寸输入张量并输出可变尺寸张量的GRU？( Kumar等人，2015年的执行情况)

为此，我的意图是使用中方程9和10中描述的GRU，解码来自情景记忆的输出( 和中的m^T)。该[batch_size x 1 x embedding_size]单元需要一个尺寸为[batch_size x answer_length x vocab_size]的三维张量作为输入，即从片段存储器m^T中得到的整形输出，并输出尺寸为[batch_size x answer_length x vocab_size]的三维张量。此外，我不确定如何实现它，使它接受一个固定大小的输入张量，并输出一个可变大小的张量(因

浏览 4修改于2017-11-08得票数 0

2回答

钉扎内存在PyTorch中实际上要慢一些吗？

返回的张量仍然在CPU上，之后我必须手动调用.cuda(non_blocking=True)。如果不是这样的话，我们为什么要做引脚记忆呢？ a = np.memmap('..out of memory at /tmp/pip-req-build-58y_cjjl/aten/src/THC/THCCachingHostAllocator.cpp:296

浏览 2修改于2019-11-07得票数 15

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

当不再需要时，如何从记忆中释放张量？

在PyTorch中，是什么使张量具有非连续的记忆？

如何在tensorflow上将3D矩阵的每一行与另一个3D矩阵的每个元素相乘？

在深度强化学习中，我是计算每个迷你批次的一个损失，还是计算每个迷你批次的一个损失？

如何对张量数据的均值和标准差进行增量更新？

当试图用py手电筒启动零张量时的内存问题

PyTorch:为什么运行output =model(映像)需要这么多GPU内存？

TensorFlow:如何测量每个张量所需的GPU内存？

如何用NHWC数据初始化火炬NCHW通道的最后张量？

将内存块分配给py-火炬输出张量(C++ API)

如何在做两个稀疏矩阵的张量乘积后消除零点？

在神经网络推理过程中，你在内存的哪一部分存储模型权重和中间值？

如何从内存中手动删除张量？

张量运算中的内存和时间

由Tensorflow 2.0中的前身增加张量的每个元素

如何在PyTorch中使用LSTM进行强化学习？

tensorflow中稠密向量与稀疏矩阵的乘法

有没有办法在码头集装箱之间发送gpu内存中的gpu张量的位置，并在不同的容器中构建它们？

如何在Tensorflow中实现采用固定尺寸输入张量并输出可变尺寸张量的GRU？( Kumar等人，2015年的执行情况)

钉扎内存在PyTorch中实际上要慢一些吗？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐