我有Coral AI usb TPU,我成功地运行了入门示例,部署了已经编译/训练过的示例模型(图像分类),并在TPU上运行了一个鹦鹉图像推理:
python3 examples/classify_image.py(例如,我的笔记本电脑或Raspberry Pi )中运行相同模型的推理,以比较在加速器中运行推理所需的时间,比如Coral AI和通用CPU。如果我的理解是正确的,那么示例mobilenet_v2_1.0_224_inat_bird_quant_edgetpu.tflite是一个包含thos
我正在运行多个python进程(在本例中使用多处理模块)来检测人员(使用ssd模型),每个进程都有自己的OpenVINO推理引擎。我得到一个非常低的FPS (不超过10)为每个过程。我怀疑CPU没有得到最佳利用,因为每个引擎生成的线程数量很高,这增加了CPU跨进程的开销,也增加了CPU的共享。My CPU details are:-4 cores each socket Total - 8 CPUs
在这
在计算机GPU计算上大大加快了推理速度,但在我的手机上,GPU上的推理速度比CPU慢约30倍。对于我输入的所有输入数组,n都在400-800之间,但是我尝试了一个更大的n,看看是否我注意到的减慢是由于运行GPU推理时创建了一个委托内核。对于较大的n,GPU的推理时间接近CPU,这让我认为GPU代理可能只是在我手机的CPU上进行计算。以下是CPU/GPU计时与n的大小比较的一些示例: N = 500GPU