尽管调整环境变量会有很大的收益,这在下面讨论,但简单的建议是将其设置为inter_op_parallelism_threads等于物理CPU的数量并设置以下环境变量: KMP_BLOCKTIME=0 KMP_AFFINITY=granularity