首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >关于CUFFT输入大小

关于CUFFT输入大小
EN

Stack Overflow用户
提问于 2015-03-06 21:39:54
回答 2查看 190关注 0票数 0

CUFFT库支持的算法可以用2^a、X3、bX5、cX7、d等形式进行优化。

他们怎么能做到这一点?

据我所知,FFT只能为2^a输入大小提供最佳性能。

EN

回答 2

Stack Overflow用户

发布于 2015-04-09 23:54:10

这意味着,素数因子大于7的输入大小会变慢。

票数 0
EN

Stack Overflow用户

发布于 2017-03-08 16:31:21

Cooley算法可以对各种不同的DFT长度进行运算,可以表示为N= N_1*N_2,该算法将长度N的DFT递归表示为长度为N_2的较小的DFT。

正如您注意到的,最快的通常是基-2因式分解,它递归地将长度N的DFT分解为长度N/2的2个较小的DFT,运行在O(NlogN)中。

然而,实际性能将取决于硬件和实现。例如,如果我们考虑线程翘曲大小为32的cuFFT,那么长度为32的DFT将是最优的(注意:仅举一个例子,我不知道cuFFT下存在的实际优化)。

简单回答:基于Cooley-Tukey基-n算法,对任意素数分解的基础代码进行了优化,最多可达7。

http://mathworld.wolfram.com/FastFourierTransform.html

algorithm

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28908138

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档