我查看了分析结果,发现thrust::min_element()调用了cudaMalloc(),因此使用了额外的内存。在归约之后,我不需要数组数据,所以我更喜欢就地查找最小元素。有可能吗?
发布于 2012-04-12 02:32:48
Thrust的缩减只使用O(1)临时存储(实际上是O(#processors)),但如果你坚持自己管理分配,你可以使用implement your own custom allocation scheme。
https://stackoverflow.com/questions/10041853
复制相似问题