我正在尝试创建一个脚本,它从一个独立的模块调用一个函数来进行并行处理。
我的“顶级”剧本是这样的:
from hydrology import model, descriptors
if __name__ == "__main__":
datafile = r"C:\folder\datafile.shp"
myModel = model.Model(data = datafile)
res = descriptors.watershed_pll(myModel)descriptors模块如下所示:
from multiprocessing import Pool
from arcfunc import multi_watershed
def watershed_pll(model):
pool = Pool()
for key, val in model.stations.iteritems():
res = pool.apply_async(multi_watershed(val, key))
pool.close()
pool.join()
return res如您所见,并行运行的函数是从模块arcfunc导入的,执行并行化的函数在模块descriptors中,运行所有东西的脚本再次分离。
在我运行时没有例外,但是我有两个问题:
我怀疑我的架构正在使事情复杂化,但是,并行化功能在一个单独的模块中是很重要的。
有什么建议吗?
发布于 2014-02-14 11:26:32
代码没有将函数和参数传递给apply_async,而是直接调用multi_watershed (在主进程中),并传递函数的返回值。
传递函数和参数。
替换以下一行:
res = pool.apply_async(multi_watershed(val, key))通过以下方式:
res = pool.apply_async(multi_watershed, (val, key))https://stackoverflow.com/questions/21778026
复制相似问题