我有一个1024*128*20大小的复杂数据。我需要为128*20个块找到1024点的FFT。我计划使用英特尔MKL或英特尔IPP来查找相同的内容。是否可以使用英特尔MKL或IPP并行化代码?在最小计算时间方面,MKL和IPP哪个更好?
发布于 2017-08-19 02:08:00
我建议你阅读:https://software.intel.com/en-us/articles/mkl-ipp-choosing-an-fft/,它提供了一个很好的比较,可以更容易地决定哪个更适合你的用例。
IPP和MKL都可以完成这项工作,但哪种计算时间更短可能取决于您的硬件,因为它们是以不同的方式优化的,例如,IPP只能与FFT的2次方大小的数组一起工作,而MKL可能更通用(根据文章)。
(很抱歉撞到了一个“旧”问题,但尚未选择答案,该问题仍然相关)
发布于 2016-05-09 03:50:45
我认为它们具有相同的性能,因为它们都是由Intel开发的。我更喜欢MKL,因为它有更多的用户。
MKL和IPP都支持并行FFT。然而,我建议你在更高的级别上利用并行性,因为你有很多FFT块要做。对于每个1024-FFT,您可以使用MKL中的顺序版本。
https://stackoverflow.com/questions/36997720
复制相似问题