用于编写在cuSPARSE实例上工作的自定义(按元素或原始)内核的API是什么?如果我想编写一个可以将cupyx.scipy.sparse.csr_matrix实例作为参数的内核,那么底层的CUDA代码需要使用哪些参数?
发布于 2022-09-05 04:31:14
找到了(至少大约)。对于CSR稀疏矩阵s,字段s.data、s.indices和s.indptr分别包含非零项的长度s.nnz的密集数组、列索引的长度s.nnz的密集数组以及indices中每一行起始位置(相对地址)的列表。这些都是普通的cupy.ndarray,可以作为普通的传递到内核,然后传递到cuSPARSE函数。
https://stackoverflow.com/questions/73603963
复制相似问题