我正在研究如何优化算法。(Skiena教授的算法指南)Suppose the following algorithm is used to evaluate the polynomial−1(xn−1) + . . . + a(x) + axpower := 1;xpower := x ∗ xpower;p := a0;for i := 1 to n do
我目前正在阅读一篇关于github的文章,内容是使用Clang的扩展向量语法进行性能优化。作者给出了以下代码片段:
float8 aa = BroadcastFloat8(A(ai, p));
csum[ai][bi] += aa * bbfor (int ai = 0; ai < regsA; <e