文章/答案/技术大牛

发布

社区首页 >问答首页 >这种优化技术的名称是什么？

问这种优化技术的名称是什么？
EN

Stack Overflow用户

提问于 2015-03-01 19:21:27

回答 3查看 131关注 0票数 1

以下优化技术的名称是什么?为什么它比以前的实现更好？

const int size = 100;
int arr1[size];
int arr2[size];

双环

for(int i=0; i<size; ++i)
    arr1[i] = 1;

for(int i=0; i<size; ++i)
    arr2[i] = 1;

转到单环

for(int i=0; i<size; ++i) {
    arr1[i] = 1;
    arr2[i] = 1;
}

编辑

备选方案如下；

指针混叠
循环不变码运动
复制伊莉森
环路融合
回路展开

c++

for-loop

compiler-optimization

回答 3

Stack Overflow用户

回答已采纳

发布于 2015-03-01 19:26:53

维基百科将这种优化称为https://en.wikipedia.org/wiki/Loop_fusion。这个想法是，对于这两个循环，循环控制流的开销不会增加一倍。如果组合循环的内存访问模式很差，这可能不会对性能产生预期的影响，但由于您的示例中的两个循环都按顺序访问相邻的内存块，因此硬件应该能够有效地处理它。

在转换之前，每个循环都这样做：

用0初始化i。
加载常量size。
如果是i >= size，跳到8。
加载开始数组的地址arr1。
将常量1存储在地址arr1 + i。
i增量为1。
跳到3。
结束

然后立即：

用0初始化i。
加载常量size。
如果是i >= size，跳到16。
加载开始数组的地址arr2。
将常量1存储在地址arr2 + i。
i增量为1。
跳到11点。
结束

任何编译器可能做的第一件事是将“加载常量size”和“加载地址arr”从循环体中移出。然而，总工作量与有用工作的比率却不是很好。将其与组合循环进行比较：

用0初始化i。
加载常量size。
如果是i >= size，跳到10。
加载开始数组的地址arr1。
将常量1存储在地址arr1 + i。
加载开始数组的地址arr2。
将常量1存储在地址arr2 + i。
i增量为1。
跳到3。
结束

将子弹点作为机器指令的一种衡量标准，并不是最精确地解释性能的方法。您需要知道实际硬件支持什么指令才能实际比较所需指令的数量。

票数 1

Stack Overflow用户

发布于 2015-03-01 19:26:29

它被称为环路融合 (或者循环干扰，正如维基百科所指出的那样)，正如你可能理解的那样，在没有相互参照的情况下，两个相邻的循环可以在相同的范围内迭代。

请注意，这并不一定总是提高速度。

票数 3

Stack Overflow用户

发布于 2015-03-01 19:30:54

在我看来，这更像是悲观！

您完全破坏了循环中访问的数据的内存局部性，并可能导致大量缓存丢失。

确定的唯一方法当然是测量它，但是突然得出结论，这是一种“优化”，仅仅因为您在i上只进行了一半的增量和比较，这是愚蠢的。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/28797953

复制

相似问题

问这种优化技术的名称是什么？
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问这种优化技术的名称是什么？EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问这种优化技术的名称是什么？
EN