首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Apache Spark,我如何一次将相同的函数应用于15k GraphFrame图形?

Apache Spark,我如何一次将相同的函数应用于15k GraphFrame图形?
EN

Stack Overflow用户
提问于 2017-09-05 18:00:43
回答 1查看 54关注 0票数 1

我用GraphFrame创建了15k的图形对象。这些图表非常小。我只需要在每个图上应用最短路径和某些其他算法。我目前的实现是使用for循环遍历所有15k个图。

我想以某种方式构造一个RDD,它将每个图作为它的项目。在这种情况下,我可以将我需要应用的所有算法放在一个用户定义的函数中,并使用RDD的map函数在每个图上应用该函数。我想这会更有效率。

但问题是,我如何创建这样的RDD?

EN

回答 1

Stack Overflow用户

发布于 2017-09-05 18:22:28

为了加速您的过程,我建议您将图表放在list中并使用并行映射,例如:

代码语言:javascript
复制
from multiprocessing.pool import ThreadPool

def your_algos(p):
    # your code

your_graphs = [list_of_graphs]

p = ThreadPool(number_of_workers)
results = p.map(your_algos, your_graphs) 
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/46052221

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档