我在使用FFTW创建并行的OMP DFT时遇到了一些问题。我使用--enable-openmp进行了编译,并具有以下代码示例:
#include <fftw3.h>
int NUMBER_OF_THREADS = 40;
fftw_init_threads();
fftw_plan_with_nthreads(NUMBER_OF_THREADS);
std::vector<std::complex<double>> buf(num_trials);
fftw_plan p = fftw_plan_dft_1d(num_trials, reinterpret_cast<fftw_complex*>(buf.data()), reinterpret_cast<fftw_complex*>(buf.data()), -1, FFTW_MEASURE);
// plan is called here sequentially some number of times
for (dummy in dummy) {
fftw_execute(p);
}
fftw_destroy_plan(p);不幸的是,代码似乎没有并行化。我在Makefile中使用了以下标志:
CXXFLAGS = -fopenmp -O3 -std=c++17 -funroll-loops -march=native -Wno-unused -Wall -I. -g
LDFLAGS = -I /usr/local/include -L /usr/local/lib -lfftw3_omp -lfftw3 -lm是否有详细说明如何使用OpenMP快速傅立叶变换的代码示例?我到底做错了什么?Reference FFTW doc。
发布于 2020-12-21 00:18:45
-fopenmp是(也是?)链接器标志。将其从CXXFLAGS移动(或复制,以安全起见)到LDFLAGS。我希望这会有所帮助。-I /usr/include对链接器没有影响;将其移至CXXFLAGS (或在不必要时删除)https://stackoverflow.com/questions/65349754
复制相似问题