我正在运行多个python进程(在本例中使用多处理模块)来检测人员(使用ssd模型),每个进程都有自己的OpenVINO推理引擎。我得到一个非常低的FPS (不超过10)为每个过程。我怀疑CPU没有得到最佳利用,因为每个引擎生成的线程数量很高,这增加了CPU跨进程的开销,也增加了CPU的共享。另外,对于单个进程,OMP_NUM_THREADS设置为4的情况下,我将增加到60 for。My CPU details are:-4 cores each
我有Coral AI usb TPU,我成功地运行了入门示例,部署了已经编译/训练过的示例模型(图像分类),并在TPU上运行了一个鹦鹉图像推理:--labels test_data/inat_bird_labels.txt \但是,我想在计算机CPU(例如,我的笔记本电脑或Raspberry Pi )中运行相同模型的推