为了在带有CUDA的GPU上使用数据并行算法,有两个标准库CUDPP和sorting,它们实现了排序、归约、前缀求和等功能。
那么,就性能和功能而言,这两个库之间的主要区别是什么?
发布于 2012-07-20 16:02:52
大约一年前,我使用过排序和前缀sums (使用CUDA 4.1,但我不记得推送和CUDPP的版本了),我体验到CUDPP更快一些,但推送更容易使用(使用具有大约200M条目的浮点数组)。
至于功能,据我所知,您也可以使用主机内存推力不仅与设备内存(而不是CUDPP),但这可能是过时的。
https://stackoverflow.com/questions/11563301
复制相似问题