我有巨大的矩阵,我希望矩阵的输出与输入矩阵的大小相同,只是每个单元格都从相邻的单元格获得数字的总和。
您能指导我如何使用CUDA在GPGPU平台上使用它吗?
发布于 2011-05-06 00:30:29
您必须将所有相邻单元格的值传递给内核(作为参数),以便能够进行求和。参数列表和后面的代码如下所示:( int actualCellvalue,int adj1,int adj2,int adj3...)
{ actualCellvalue = actualCellvalue + adj1 + adj2 + adj3....;}
这可能是错误的,但这就是我从你非常简短的描述中发现的。
打招呼,彼得
https://stackoverflow.com/questions/3981034
复制相似问题