文章/答案/技术大牛

发布

社区首页 >问答首页 >关于CUFFT输入大小

问关于CUFFT输入大小
EN

Stack Overflow用户

提问于 2015-03-06 21:39:54

回答 2查看 190关注 0票数 0

CUFFT库支持的算法可以用2^a、X3、bX5、cX7、d等形式进行优化。

他们怎么能做到这一点？

据我所知，FFT只能为2^a输入大小提供最佳性能。

cufft

回答 2

Stack Overflow用户

发布于 2015-04-09 23:54:10

这意味着，素数因子大于7的输入大小会变慢。

票数 0

Stack Overflow用户

发布于 2017-03-08 16:31:21

Cooley算法可以对各种不同的DFT长度进行运算，可以表示为N= N_1*N_2，该算法将长度N的DFT递归表示为长度为N_2的较小的DFT。

正如您注意到的，最快的通常是基-2因式分解，它递归地将长度N的DFT分解为长度N/2的2个较小的DFT，运行在O(NlogN)中。

然而，实际性能将取决于硬件和实现。例如，如果我们考虑线程翘曲大小为32的cuFFT，那么长度为32的DFT将是最优的(注意:仅举一个例子，我不知道cuFFT下存在的实际优化)。

简单回答:基于Cooley-Tukey基-n算法，对任意素数分解的基础代码进行了优化，最多可达7。

http://mathworld.wolfram.com/FastFourierTransform.html

algorithm

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/28908138

复制

相似问题

问关于CUFFT输入大小
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问关于CUFFT输入大小EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问关于CUFFT输入大小
EN