首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >pyCUDA缩减不起作用

pyCUDA缩减不起作用
EN

Stack Overflow用户
提问于 2015-02-14 09:25:42
回答 1查看 520关注 0票数 0

我使用的缩减代码基本上与文档中的示例完全相同。下面的代码应该返回2^3 + 2^3 = 16,但它返回9。我做错了什么?

代码语言:javascript
复制
import numpy
import pycuda.reduction as reduct
import pycuda.gpuarray as gpuarray
import pycuda.autoinit
from pycuda.compiler import SourceModule as module

newzeros = [{1,2,3},{4,5,6}]
gpuSum = reduct.ReductionKernel(numpy.uint64, neutral="0", reduce_expr="a+b", map_expr="1 << x[i]", arguments="int* x")
mylengths = pycuda.gpuarray.to_gpu(numpy.array(map(len,newzeros),dtype = "uint64",))
sumfalse = gpuSum(mylengths).get()
print sumfalse
EN

回答 1

Stack Overflow用户

发布于 2015-02-14 09:32:57

我刚想通了。定义内核时使用的参数列表应该是unsigned long *x,而不是int *x。我在其他地方都使用64位整数,结果弄得一团糟。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28511427

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档