在NFFT包中,有用于向量和矩阵的快速、专门的函数和用于一般数组的慢函数。我想使通用功能和专门功能过时,但我遇到了麻烦。
一个特殊函数族本质上是这样的(offset是在实际代码中计算的,但它的值对这个问题并不重要):
myfunc!(f::Vector, g::Vector)
offset = 5
n = length(g)
N = length(f)
for l = 1:N
g[ ((l+offset)%n)+1 ] = f[l]
end
end和
myfunc!(f::Matrix, g::Matrix)
offsetx = 5
offsety = 5
n1, n2 = size(g)
N1, N2 = size(f)
for ly = 1:N2
for lx = 1:N1
g[ ((lx+offsetx)%n1)+1, ((ly+offsety)%n2)+1 ] = f[lx, ly]
end
end
end一般的函数可以这样写
myfunc!{D}(f::Array{D}, g::Array{D})
offset = ntuple(d -> 5, D)
n = size(g)
for l in CartesianRange(size(f))
idx = CartesianIndex{D}( ntuple(d -> ((l[d]+offset[d])%n[d])+1, D) )
g[ idx ] = f[l]
end
end不幸的是,这是非常缓慢的。大部分时间花在循环中的ntuple中。
idx的其他可能性包括允许idx = Array{Int}(D)和使内部循环看起来像
for d = 1:D
idx[d] = ((l[d]+offset[d])%n[d])+1
end
g[idx...] = f[l]这也是缓慢的。
我认为,由于维度D是一个类型参数,所以可以为计算idx创建一个@generated函数,但我不知道如何做到这一点(或者是否有更好的方法)。
我用的是Julia v0.4.5。
发布于 2016-08-11 07:43:42
如何使用生成的函数执行此操作的答案是使用Base.Cartesian助手宏。
using Base.Cartesian
@generated function myfunc!{T,D}(f::Array{T,D}, g::Array{T,D})
quote
@nexprs $D d->offset_d=5 #Declase offset_1=5, offset_2=5 etc
@nloops $D l f begin
(@nref $D g d->(l_d+offset_d)%size(g,d)+1) = @nref $D f l
end
end
end我已经确认这是正确的,至少对2D而言。我把它留给读者来描述。它或多或少不分配。
https://stackoverflow.com/questions/38889303
复制相似问题