如果一个gpu/cpu拥有两倍的GFlops,那么另一个是否意味着该设备上的神经网络的训练速度将提高一倍?
发布于 2018-04-04 17:06:50
每秒触发器或浮点操作是性能的度量,意味着计算机执行计算的速度。GFLOP是一个简单的千兆失败。因此,有2倍高的GFLOP值的GPU非常有可能加速训练过程。然而,2的因素将是某种上限,因为您将有其他部分,不依赖于计算能力,如内存速度,RAM,甚至其他条件,如冷却系统的GPU/CPU和其他(是的,这可能影响计算速度)。在这里,您应该问,GPU/CPU计算实际占用了多少培训时间?如果是80%,那么你可以显着地加快训练,如果是20%,那么很可能不会。如果您确信大部分时间都是通过GPU计算完成的,那么接下来应该考虑的是影响触发器数量的因素:
因此,很难说你会从更多的失败中得到多少。如果您使用两个GPU,那么您将增加2个类似于第1段的触发器。使用两个GPU也会增加GPU内存,如果单个GPU没有足够的GPU,并且代码必须经常从内存中读取数据,这是有帮助的。
因此,失败对训练速度的影响是相当复杂的,因此它将取决于很多因素,比如你的网络有多平行,如何达到更高的错误量,内存的使用等等。
https://stackoverflow.com/questions/49656120
复制相似问题