当在C++中向一个非常大的双倍动态向量中添加双倍时,我正经历一些未知的减速。
如下图所示,减速的具体原因是增加了一个由cos和sin函数的长和计算的双倍。
如果只将A_temp1添加到动态向量中,则不会出现减速:
for(int i=0;i<=imax;i++){
// neither of these cause slowdown on their own
A_temp1 = pi;
A_temp2 = [long-winded sum of sin and cos operations];
// no slowdown if only A_temp1 is added
A_dyn_vec[i] = A_temp1;
}但是,当将A_temp2添加到向量中时,会出现明显的减速:
for(int i=0;i<=imax;i++){
// neither of these cause slowdown on their own
A_temp1 = pi;
A_temp2 = [long-winded sum of sin and cos operations];
// significant slowdown
A_dyn_vec[i] = A_temp1 + A_temp2;
}此外,当两者合并为单个A_temp值时,也会出现同样的显著放缓:
for(int i=0;i<=imax;i++){
// neither of these cause slowdown on their own
A_temp = pi + [long-winded sum of sin and cos operations];
// significant slowdown
A_dyn_vec[i] = A_temp;
}总之,由于某种原因,添加A_temp1并不会导致增长放缓,但A_temp2会造成放缓,尽管两者都是双倍的。
A_temp2特别来自一个函数,它包含了cos和sin函数的长卷和。也许这个数字的存储方式是导致这个问题的原因,但我不知道确切的原因。
如果有人能就这种情况下经济放缓的原因以及如何避免这种情况提出意见,我将不胜感激。
谢谢!
发布于 2020-05-06 01:37:29
如果您根本没有使用A_temp2,我相信它是一个编译器优化,而且它甚至没有计算数字,因为您没有使用它。当您开始在第二段代码中使用它时。它不能忽视导致经济增长放缓的计算。
编辑:我认为,在你的情况下,唯一的方法是让罪恶和余弦的总和更好。基本上,只需降低您所做的函数调用的数量。例如,将sin(i)^2 + cos(i)^2写为1。这将减少函数调用的次数。或者做下面的事情。
temp1 = sin(i);
temp2 = cos(i);
do the sum operation with temp1 and temp2 instead of calling the sin and cos functions again and again.https://stackoverflow.com/questions/61625839
复制相似问题