对于每秒的某些快速傅立叶变换运算,哪种处理器的性能会更好,i5-2500K还是i7-960,例如: 16k缓冲区长度的复数快速傅立叶变换?
我之所以问这个问题,是因为我想使所有内核和所有线程饱和,而且由于i7有8个线程,而i5只有4个,所以我主要关心的是SSE指令是否能够在所有8个逻辑线程上并行运行。
发布于 2011-07-30 16:30:03
此测试http://ixbtlabs.com/articles3/cpu/ci7-turbo-ht-p1.html?pages=ci7-turbo-ht-p1.html
显示在i7上打开HT对快速傅立叶变换的增益为0%。(科学申请表,FFT行)。FFT来自MATLAB (基于一个名为FFTW的库)。
i7-960有4个内核和8个线程,来自HyperThreading (HT)。正如ixbt所显示的,HT不会帮助计算更多的FFT,所以我建议你购买更新的i5-2500,相同的4核,但更高的频率,更大的涡轮加速(动态超频)和更新的技术。
此外,这个“i5”是下一个微架构(SNB - Sandy Bridge),它有一个AVX (每个GHz的两倍多的FLOPS )。如果快速傅立叶变换可以使用它(使用现代的库和现代的编译器),它应该几乎两倍的快速傅立叶变换性能(如果我们不考虑内存带宽限制)。英特尔表示,在他们的新MKL中,AVX增长了1.8倍:http://software.intel.com/en-us/articles/intel-avx-optimization-in-intel-mkl-v103/
AVX/NHM (在Nehalem NHM上启用AVX)使用N=1024时,基数-2 1D CFFT的加速比为1.8倍
因此,i5-2500是AVX的1.8倍,它有更多的GHz (来自spec和TurboBoost),并且它支持更快的内存(用于NHM的DDR3-1066和用于i5 SND的DDR3-1333 )。
发布于 2011-07-30 15:20:52
我会说不,有8个线程的i7的其中一件事是,在上下文切换期间(由于逻辑核心的原因,将更频繁地发生)i7状态不会被保留,这意味着一旦FPU操作恢复,它必须重新填充FPU结构,以便它可以完成操作。据我所知,i5-2500k会做得更快,因为线程只在每个内核上竞争,而不是使用更高的竞争速率来使用FPU (只有4个)。
附言:我可能是错的,因为我不确定960的细节,但这是我在过去所做的一些工作中发现的。
https://stackoverflow.com/questions/6881735
复制相似问题