问当输入数据大小大于700,000时，cudppscan输出错误
EN

Stack Overflow用户

提问于 2011-07-25 20:03:30

回答 1查看 204关注 0票数 1

我使用CUDA cudppScan来计算元素数组的前缀和。当输入数据较小时，这种方法效果很好。但是，当数据大小大于大约700,000时，输出的某些元素被证明是错误的值。

我正在对一个包含所有1的数组执行cudppScan，所以输出应该是1, 2, 3, 4, ...。

下面是我的代码：

void
runTest( int argc, char** argv) 
{
    // use command-line specified CUDA device, otherwise use device with highest Gflops/s
    if( cutCheckCmdLineFlag(argc, (const char**)argv, "device") )
        cutilDeviceInit(argc, argv);
    else
        cudaSetDevice( cutGetMaxGflopsDeviceId() );

    int num_elements = 670000;

    int *h_isCommon;
    int *d_isCommon;
    int *d_scan_odata;

    h_isCommon = (int *) malloc(sizeof(int) * num_elements);
    CUDA_SAFE_CALL(cudaMalloc((void**)&d_isCommon,   sizeof(int) * num_elements));
    CUDA_SAFE_CALL(cudaMalloc((void**)&d_scan_odata, sizeof(int) * num_elements));

    for(int i = 0; i < num_elements; i++) h_isCommon[i] = 1;
    CUDA_SAFE_CALL(cudaMemcpy(d_isCommon, h_isCommon, sizeof(int) * num_elements, 
        cudaMemcpyHostToDevice));


    CUDPPConfiguration config;
    CUDPPHandle scanplan;

    config.op           = CUDPP_ADD;
    config.datatype     = CUDPP_INT;
    config.algorithm    = CUDPP_SCAN;
    config.options      = CUDPP_OPTION_FORWARD | CUDPP_OPTION_INCLUSIVE;
    scanplan = 0;
    CUDPPResult result_cudpp = cudppPlan(&scanplan, config, 4000000, 1, 0);


    cudppScan(scanplan, d_scan_odata, d_isCommon, num_elements);
    CUDA_SAFE_CALL(cudaThreadSynchronize());

    CUDA_SAFE_CALL(cudaMemcpy(
            h_isCommon, 
            d_scan_odata, 
            sizeof(int) * num_elements, 
            cudaMemcpyDeviceToHost));

    for(int i = 1; i < num_elements; i++) {
        if(h_isCommon[i] != h_isCommon[i - 1] + 1)
            printf("error %d, %d\n", h_isCommon[i], h_isCommon[i - 1]);
        //if(i != 0 && i % 10 == 0) printf("\n");
        //printf("%8d", h_isCommon[i]);
    }
    printf("\n");

    CUDA_SAFE_CALL(cudaFree(d_isCommon));
    CUDA_SAFE_CALL(cudaFree(d_scan_odata));
    free(h_isCommon);
    cudaThreadExit();
}

所以请帮我指出我哪里做错了。提前谢谢。

cuda

cudpp

回答 1

Stack Overflow用户

发布于 2011-07-26 14:46:31

请尽快将您的问题提交到http://code.google.com/p/cudpp/issues/list。我们正在为CUDPP 2.0的发布做好准备，如果有问题的话，我们想解决这个问题。

如果你运行"cudpp_testrig -scan -n=670000“，这个问题会重现吗？

此外，如果您可以从SVN trunk上查看最新版本，并尝试使用它，看看它是否仍然失败，这将对我们有所帮助。(如果它通过了，不要提交问题。)

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/6815806

复制

相似问题

问当输入数据大小大于700,000时，cudppscan输出错误
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问当输入数据大小大于700,000时，cudppscan输出错误EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问当输入数据大小大于700,000时，cudppscan输出错误
EN