我有一个加权移动平均函数,它通过用高斯加权机制平均每个点的3*宽度值来平滑一条曲线。我只担心平滑一个由开始、结束所限制的区域。下面的代码可以工作,但问题是运行时有大型数组。
import numpy as np
def weighted_moving_average(x, y, start, end, width = 3):
def gaussian(x, a, m, s):
return a*exp(-(x-m)**2/(2*s**2))
cut = (x>=start-3*width)*(x<=end+3*width)
x, y = x[cut], y[cut]
x_avg = x[(x>=start)*(x<=end)]
y_avg = np.zeros(len(x_avg))
bin_vals = np.arange(-3*width,3*width+1)
weights = gaussian(bin_vals, 1, 0, width)
for i in range(len(x_avg)):
y_vals = y[i:i+6*width+1]
y_avg[i] = np.average(y_vals, weights = weights)
return x_avg, y_avg根据我的理解,循环遍历NumPy数组通常是效率低下的。我想知道是否有人想用更高效的运行时替代for循环。
谢谢
发布于 2016-07-20 22:21:20
在加权窗口上的切片和求和/平均基本上对应于一维卷积,核被翻转。现在,对于 convolution来说,NumPy在np.convolve中有一个非常有效的实现,它可以用来摆脱循环,给我们提供y_avg。因此,我们将有一个向量化的实现,类似于-
y_sums = np.convolve(y,weights[::-1],'valid')
y_avg = np.true_divide(y_sums,weights.sum())发布于 2016-07-20 22:24:58
在大数组上循环的主要关注点是,大数组的内存分配可能很昂贵,在循环开始之前必须初始化整个过程。
在这种特殊的情况下,我会同意Divakar所说的话。
通常,如果您发现自己处于一个真正需要迭代大型集合的环境中,请使用迭代器而不是数组。对于这种相对简单的情况,只需将range替换为xrange (参见https://docs.python.org/2/library/functions.html#xrange)即可。
https://stackoverflow.com/questions/38491572
复制相似问题