首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >RDD API Python如何计数

RDD API Python如何计数
EN

Stack Overflow用户
提问于 2021-06-17 04:06:44
回答 1查看 26关注 0票数 0

我有一个包含如下元素的文件:

1,1_id,卢卡斯,10岁

2,2_is,皮埃尔,30岁

2,3_id,卢卡斯,20岁

我想要这样的结果:

(卢卡斯,30),(皮埃尔,30)

我只需要使用RDD方式。

你有什么想法吗?

非常感谢

EN

回答 1

Stack Overflow用户

发布于 2021-06-17 09:34:30

这很容易。

代码语言:javascript
复制
# get last two elements
def f(s):
    s_list = s.split(',')
    return (s_list[2], int(s_list[3]))

r = sc.textFile('YOUR_FILE').\
        map(lambda line:f(line)).\
        reduceByKey(lambda x, y: x + y)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68009397

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档