我使用QR和LU分解以及cuSolver库中稀疏矩阵的求解函数。根据文档,LU函数只能在主机路径上可用,而QR函数也可以在设备上使用。
我想知道是否有任何设置或类似于控制主机和设备功能的并行化设置。两种类型的函数的线程数是如何控制的?
发布于 2021-08-09 04:25:39
没有任何并行化设置。
线程数不能直接控制,也没有公开描述函数在所要求的级别上是如何工作的。
图书馆是不透明的。与库调用启动的任何内核调用相关联的线程数将由库使用的启发式来确定,而这个启发没有被描述。
https://stackoverflow.com/questions/68704294
复制相似问题