首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用cublas saxpy时出错

使用cublas saxpy时出错
EN

Stack Overflow用户
提问于 2012-09-15 08:43:49
回答 1查看 958关注 0票数 1

我正在尝试使用cublas中的cublasSaxpy函数。

看一下代码:

代码语言:javascript
复制
#include <cublas_v2.h>

float *dev_B;
float *dev_tmp;

cublasStatus_t stat ;
cublasHandle_t handle ;
...
...
stat = cublasCreate(&handle);
if(stat != CUBLAS_STATUS_SUCCESS)
{
    cout << "CUBLAS Initialization failed!" << endl;
    exit(EXIT_FAILURE);
}
...
...
stat = cublasSetVector(N, sizeof(float), vB, N, dev_B, N);
if(stat != CUBLAS_STATUS_SUCCESS)
{
    cout << "CUBLAS setting vector failed" << endl;
    exit(EXIT_FAILURE);
}

stat = cublasSetVector(N, sizeof(float), nullvec, N, dev_tmp, N);
if(stat != CUBLAS_STATUS_SUCCESS)
{
    cout << "CUBLAS setting vector failed" << endl;
    exit(EXIT_FAILURE);
}
...
...
stat = cublasSaxpy(handle, N, 1.0f, dev_B, 1, dev_tmp, 1);

所以,我使用的是CUDA5.0 RC1中的eclipse nsight。我没有构建这个项目,因为我没有完成它,但是IDE在saxpy操作中给了我一个read下划线:

代码语言:javascript
复制
Invalid arguments '
Candidates are:
enum {cublas_api.h:3039} cublasSaxpy_v2(cublasContext *, int, const float *, const float *, int, float *, int)
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-09-15 13:28:21

在CUBLAS V2 API中,所有标量实数参数都是通过引用传递的,而不是通过值传递的。正确的saxpy调用应该是这样的:

代码语言:javascript
复制
const float alpha = 1.0f;
stat = cublasSaxpy(handle, N, &alpha, dev_B, 1, dev_tmp, 1);

文档中清楚地讨论了这一点。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12433620

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档