是否有一种方便和有效的方式来使用cpp标准容器API以NUMA感知的方式?
我想在cpp环境中做一个OpenMP并行稀疏矩阵向量乘法。要分配和初始化与NUMA域有关的向量和矩阵值,C代码可能会类似于这样:
size_t N = 1000000;
double* vecVal = malloc (N*sizeof(double));
#pragma OMP parallel for
for (size_i=0; i<N; ++i)
{
vecVal[i] = 0.;
}
/* do spMV */
delete vecVal;在Cpp中,我想使用std::vector (std::array具有固定大小的数组也可以)。std::vector::reserve()会起什么作用吗?做这样的事合法吗?
std::vector<double> vec;
vec.reserve(N);
double *vecVal = vec.data();
#pragma OMP parallel for
for (size_i=0; i<N; ++i)
{
vecVal[i] = 0.;
}
/* do spMV */之后,我如何将正确的大小设置为std::向量?
有谁知道更优雅的方式吗?
发布于 2016-05-12 10:11:35
你必须在这里使用一个特殊的努马感知分配器。我们在这里实现了类似于HPX的东西:allocator.hpp
其基本思想是在分配器的分配函数中进行第一次触摸。用您的#omp parallel for schedule(static)循环替换HPX执行器,您应该会没事的。
https://stackoverflow.com/questions/37006713
复制相似问题