文章/答案/技术大牛

发布

社区首页 >问答首页 >将函数的输出多处理到单个数组中

问将函数的输出多处理到单个数组中
EN

Stack Overflow用户

提问于 2020-09-04 22:48:41

回答 1查看 51关注 0票数 0

我已经尝试了很长一段时间，但是我的数组保持不变。

这里我的数组是TC_p_value，我试图模拟的函数是TC_stats。如果我们正常运行，代码运行得很好，但模拟时间太长(大约一个小时)。因此，为了减少处理时间，我将原始数组(1000x100)划分为10个100x100的小集合。尽管代码运行时没有错误，但我总是得到相同的数组(与最初定义的数组相同)。我尝试将TC_p_value定义为global，以便每次运行都可以将值分配给数组的特定部分。然而，似乎我在这里做错了什么(因为在多个处理器上模拟单个数组是不可能的)，或者是我的编码逻辑有问题？

任何帮助都是非常感谢的。同样的代码写在下面。

import pingouin as pg # A package to do regression
TC_p_value = np.zeros((Treecover.shape[1],Treecover.shape[2])) #let this array be of size 1000 x 100

def TC_stats(grid_start):
    global TC_p_value
    for lat in tqdm(range(grid_start, grid_start+100)):
        for lon in range(Treecover.shape[2]):
            TC_p_value[lat,lon] = pg.corr(y=Treecover[:, lat,lon].values,
                                  x=np.arange(1,16,1))['p-val'].values[0]

#Multiprocessing starts here
from multiprocessing import Pool
if __name__ == '__main__':
    pool = Pool()
    grid = np.arange(0,1000,100) #Running it in a group of 100, 10 times
    pool.map(TC_stats, grid)
    pool.close()
    pool.join()

python

arrays

numpy

multiprocessing

回答 1

Stack Overflow用户

发布于 2020-09-08 11:05:59

问题是全局定义的数组不能跨进程共享。因此，您需要使用共享内存。

import ctypes
import numpy as np
import pingouin as pg # A package to do regression

N, M = Treecover.shape[1], Treecover.shape[2]
mp_arr = mp.Array(ctypes.c_double, N * M)
TC_p_value = np.frombuffer(mp_arr.get_obj())
TC_p_value = TC_p_value.reshape((N, M))
#let this array be of size 1000 x 100

def TC_stats(grid_start):
    TC_p_value = np.frombuffer(mp_arr.get_obj())
    TC_p_value = TC_p_value.reshape((N, M))
    for lat in tqdm(range(grid_start, grid_start+100)):
        for lon in range(Treecover.shape[2]):
            TC_p_value[lat,lon] = pg.corr(y=Treecover[:, lat,lon].values,
                                  x=np.arange(1,16,1))['p-val'].values[0]

def init(shared_arr_):
    global mp_arr
    mp_arr = shared_arr_

#Multiprocessing starts here
from multiprocessing import Pool
if __name__ == '__main__':
    pool = Pool(initializer=init, initargs=(mp_arr,))
    grid = np.arange(0,1000,100) #Running it in a group of 100, 10 times
    pool.map_async(TC_stats, grid)
    pool.close()
    pool.join()

我用一些修改过的玩具示例运行了上面的代码，它起作用了。

参考：Use numpy array in shared memory for multiprocessing

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/63743438

复制

相似问题

问将函数的输出多处理到单个数组中
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将函数的输出多处理到单个数组中EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将函数的输出多处理到单个数组中
EN