您将如何使用矩阵传输来优化此代码以进行缓存
for (int i = 0 ; i < SIZE ; i ++) {
for (int j = 0 ; j < SIZE ; j ++) {
dest[i][j] = src[j][i];
}
}发布于 2014-04-24 08:30:53
您必须了解机器架构才能正确执行此操作。但基本上,您通常希望在N-1个线程之间分配工作(N是可用的线程数,并为主管理器线程减去1),其中每个线程的内存读/写访问块被分解为对齐的缓存线大小,以便线程不会在内存总线上争夺公共内存命中。
https://stackoverflow.com/questions/23257644
复制相似问题