我可以请教您对GNU Fortran编译器(v6.3.0)标志的建议,以便针对常春藤桥体系结构优化代码(英特尔至强CPU E5-2697v2常春藤桥@ 2.7 GHz)?
目前,我正在使用以下标志编译代码:
-O3 -march=ivybridge -mtune=ivybridge -ffast-math -mavx -m64 -w发布于 2017-03-04 00:47:26
除非您使用特定于常春藤桥的内部函数,否则Sandy bridge的标志os就足够了。我希望您可以通过设置额外的-funroll-loops --param max-unroll-times=2来获得一些好处
有时-O2 -ftree-vectorize会比-O3工作得更好。如果你有复杂的数据类型,你会想要检查vs. -fno-cx-limited-range,因为-ffast-math的默认设置可能太激进了。
https://stackoverflow.com/questions/42583992
复制相似问题