问新版本中的tf.contrib.nccl.allsum是什么？
EN

Stack Overflow用户

提问于 2020-02-28 14:16:17

回答 1查看 800关注 0票数 2

从tensorflow 1.13来看，似乎没有像tf.contrib.nccl.allsum这样的api。然而，在Nvidia官方的GitHub https://github.com/tkarras/progressive_growing_of_gans中，它使用这个旧的API来减少来自不同gpu设备的和，如下所示。

# Sum gradients across devices.
            if len(devices) > 1:
                with tf.name_scope('SumAcrossGPUs'), tf.device(None):
                    for var_idx, grad_shape in enumerate(self._grad_shapes):
                        g = [dev_grads[dev][var_idx][0] for dev in devices]
                        if np.prod(grad_shape): # nccl does not support zero-sized tensors
                            g = tf.contrib.nccl.all_sum(g)
                        for dev, gg in zip(devices, g):
                            dev_grads[dev][var_idx] = (gg, dev_grads[dev][var_idx][1])

我不确定是否有类似的api可以实现相同的集体操作，跨越不同的设备。我查看了Tensorflow官方网站，似乎程序员更喜欢使用tf.distribute.MirroredStrategy，它隐藏了NCCL的原始操作。非常感谢。

gpu

tensorflow

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-02-29 10:16:02

我认为同样的API是nccl_ops.all_sum。我用下面的代码演示了这个API。

import tensorflow as tf 
from tensorflow.python.ops import nccl_ops

a = []

with tf.device("/GPU:0"):
    g = tf.constant([1,1])
    print(g)
    a.append(g)
with tf.device("/GPU:1"):
    g = tf.constant([2,2])
    a.append(g)

b = nccl_ops.all_sum(a)
with tf.Session() as sess:
    print(sess.run(b))

我不知道tensorflow球队将来会做什么。但现在我们可以用它来做集体行动了。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60453533

复制

相似问题

问新版本中的tf.contrib.nccl.allsum是什么？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问新版本中的tf.contrib.nccl.allsum是什么？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问新版本中的tf.contrib.nccl.allsum是什么？
EN