在计算机GPU计算上大大加快了推理速度,但在我的手机上,GPU上的推理速度比CPU慢约30倍。对于我输入的所有输入数组,n都在400-800之间,但是我尝试了一个更大的n,看看是否我注意到的减慢是由于运行GPU推理时创建了一个委托内核。对于较大的n,GPU的推理时间接近CPU,这让我认为GPU代理可能只是在我手机的CPU上进行计算。以下是CPU/GPU计时与n的大小比较的一些示例: N = 500GPU
基于PyTorch教程,我在保存训练过的模型并加载它以进行推理方面没有问题。但是,加载模型所需的时间很慢。len(classes))
st = torch.load('model.pkl', map_location='cuda:0' if torch.cuda.is_available() else 'cpu在CPU上,测试一幅图像需要10秒。所以我的想法是,这可能不是正确的加载方式?, 'model_entire.pkl') 并像这样测试它: model = torc
我有Coral AI usb TPU,我成功地运行了入门示例,部署了已经编译/训练过的示例模型(图像分类),并在TPU上运行了一个鹦鹉图像推理:--labels test_data/inat_bird_labels.txt \但是,我想在计算机CPU(例如,我的笔记本电脑或Raspberry Pi )中运行相同模型的推