如果这不是微不足道的,请原谅我。我有一个小类,像这样包装cusp::csr_matrix<int,float,cusp::device_memory>:
class CuspMatrix
: public cusp::csr_matrix<int,float,cusp::device_memory>
{
...
}到目前为止,我没有做任何我认为需要为设备编译的事情。然而,我确实计划在这个特定的类中编写代码,作为一个成员/函数,应该在设备上执行,但是如果我理解正确的话,cusp已经为我提供了这个功能?例如:
ValueType v_nrm2 = cusp::blas::nrm2(V);
cusp::transpose(M,M_t);理想情况下,计算范数或转置应该针对设备执行进行编译。如果这是一个类方法的一部分,我该怎么做呢?
我是否要将类的整个*.hpp头文件作为*.cu,并将其添加到nvcc编译中?是否只标记*.cu中的实际代码(而不是头声明),并为nvcc编译添加它?或者这些都不是必要的?
发布于 2013-07-05 15:16:05
你必须记住的是,cusp是一个构建在推力之上的模板库,它也是一个模板库。cusp和thrust类方法都包含大量的设备代码,所以如果你继承它们,你也会继承大量的设备代码。
这意味着无论您选择如何构建代码,在“经典”CUDA编译中,类的实例点和所有包含的尖点和推力模板代码必须在同一翻译单元中,并且必须以nvcc认为需要设备代码编译的形式呈现给nvcc。在.cu文件中或使用适当的编译器开关)。
所以这个定义派生类并实例化它的序列:
class CuspMatrix
: public cusp::csr_matrix<int,float,cusp::device_memory>
{
...
}
...
{
CuspMatrix A;
...
}必须使用nvcc编译。
https://stackoverflow.com/questions/17480872
复制相似问题