首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用拟火花放电求出多个数组的索引值

用拟火花放电求出多个数组的索引值
EN

Stack Overflow用户
提问于 2016-10-07 22:24:35
回答 1查看 830关注 0票数 1

我有50个带有浮点值(50*7)的数组。我应该如何将同一索引上的50个数组相加为一个具有PySpark映射约简函数的数组。

示例:

代码语言:javascript
复制
array1 = {1,2,3,4,5,6,7}
array2 = {3,4,2,3,5,6,7}
....

结果应该是array3 = {4,6,5,7,10,12,14}

这是在地图还原平台上使用PySpark的一个项目要求.

现在我可以找出地图的部分:

代码语言:javascript
复制
NUM_SAMPLES = 50
result = sc.parallelize(xrange(0, NUM_SAMPLES)).map(random_generation)

这里的结果包含50个数组。函数random_generation给出了一个具有7个随机数的数组。

请任何人向我提供关于减缩部分的建议。

EN

回答 1

Stack Overflow用户

发布于 2016-10-08 04:16:46

编辑:我认为使用DataFrame更容易。

代码语言:javascript
复制
from pyspark.sql import SparkSession

spark = SparkSession \
    .builder \
    .getOrCreate()

arrays = [
    [1,2,3,4,5,6,7],
    [3,4,2,3,5,6,7],
    [1,2,3,4,5,6,7],
]

df = spark.createDataFrame(arrays)
s = df.groupBy().sum().collect()

print s
print list(s[0])

结果

代码语言:javascript
复制
[Row(sum(_1)=5, sum(_2)=8, sum(_3)=8, sum(_4)=11, sum(_5)=15, sum(_6)=18, sum(_7)=21)]
[5, 8, 8, 11, 15, 18, 21]
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39926603

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档