文章/答案/技术大牛

发布

社区首页 >问答首页 >cudaFree在cuSparse三对角线求解器中的巨大应用

问cudaFree在cuSparse三对角线求解器中的巨大应用
EN

Stack Overflow用户

提问于 2017-01-19 16:26:09

回答 1查看 149关注 0票数 0

我用cusparseDgtsv_nopivot函数来求解一个三对角方程组。输出是正确的，但功能没有适当地利用库达多流.nvvp分析器显示，虽然对该解决程序的每次调用都处于不同的流中，但它们从不重叠。我考虑了隐式同步，通过nvvp发现库函数之间有很多对cudaFree的调用。有办法避免这种隐式同步吗？

使用衬垫的伪码：

create array of streams[];
create cusparse handle;
for (int i=0;i<Nsystem;i++){
 cusparseSetStream(handle,stream[i]);
 cusparseDgtsv_nopivot(handle, var for linear system i);
}
destroy cusaprse handle;

PS:类似的cudafree问题被提出并解决了处理矩阵：这里。

concurrency

cuda

synchronization

cusolver

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-01-20 07:37:17

最简单的答案是否定。目前无法在运行时API中修改cudaFree的同步行为。

因此，如果正如您假设的那样，问题的原因是在内部使用malloc和cuSolver，那么唯一要做的事情就是向NVIDIA报告您的用户案例，看看他们是否可以提出解决方案，或者提供调用者显式管理划痕空间的例程的“专家”版本。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/41746817

复制

相似问题

问cudaFree在cuSparse三对角线求解器中的巨大应用
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问cudaFree在cuSparse三对角线求解器中的巨大应用EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问cudaFree在cuSparse三对角线求解器中的巨大应用
EN