在我的Macbook Pro 13“我有黑魔法eGPU (AMD 580)通过USB连接,这理论上应该会加快我的模型训练与Turi创造巨大。
对于一个小型模型,在我的例子中,使用了15标记的图像(4kx3k)和500个迭代,这需要大约2个小时,包括eGPU。只有CPU花了4小时,所以GPU加速了,但不是非常快。
在图里创作指南中,据说一个~700图像和4000个迭代的目标检测模型在1小时内被处理。所以快多了。
在使用CreateML时,我观察到在使用的特征检测阶段,的性能提高了至少5倍,用于传递学习。
这是框架本身的问题吗?
我可以优化数据或训练参数以更好地使用eGPU吗?
是数据太小,还是分辨率太大,无法在USB上使用最佳GPU?
Class : ObjectDetector
Schema
------
Model : darknet-yolo
Number of classes : 4
Non-maximum suppression threshold : 0.45
Input image shape : (3, 416, 416)
Training summary
----------------
Training time : 1h 29m 8s
Training epochs : 1066
Training iterations : 500
Number of examples (images) : 15
Number of bounding boxes (instances) : 49
Final loss (specific to model) : 1.808发布于 2018-11-21 14:12:19
正是图像大小/分辨率(4kx3k)造成了GPU的瓶颈。缩小图像(并相应地设置标签)使eGPU (100 labels )获得全速。
https://stackoverflow.com/questions/53410871
复制相似问题