首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >RDD内的访问元组

RDD内的访问元组
EN

Stack Overflow用户
提问于 2018-09-30 09:06:06
回答 1查看 133关注 0票数 0

输入:

代码语言:javascript
复制
('MechanicalKeyboards', 2, 'ForgetfulDoryFish')
('MechanicalKeyboards', 1, 'cheshire26')
('MechanicalKeyboards', 1, 'Sygaldry')
('scala', 5, 'hyperforce')
('xkcd', 3, 'brinjal66')
('MechanicalKeyboards', 1, 'Sygaldry')
('MechanicalKeyboards', 1, 'DzyDzyDino')

这是我的RDD。

With-e = lines.filter(lambda x: 'e' in lines[0])

期望输出:

代码语言:javascript
复制
('MechanicalKeyboards', 2, 'ForgetfulDoryFish')
('MechanicalKeyboards', 1, 'cheshire26')
('MechanicalKeyboards', 1, 'Sygaldry')
('MechanicalKeyboards', 1, 'Sygaldry')
('MechanicalKeyboards', 1, 'DzyDzyDino')

我试图过滤掉RDD元组的第一个元素中不包含'e‘的所有元素,这可能吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-09-30 09:21:47

我想你可以像下面这样做

代码语言:javascript
复制
>>> rdd = sc.parallelize([
...     ('MechanicalKeyboards', 2, 'ForgetfulDoryFish'),
...     ('MechanicalKeyboards', 1, 'cheshire26'),
...     ('MechanicalKeyboards', 1, 'Sygaldry'),
...     ('scala', 5, 'hyperforce'),
...     ('xkcd', 3, 'brinjal66'),
...     ('MechanicalKeyboards', 1, 'Sygaldry'),
...     ('MechanicalKeyboards', 1, 'DzyDzyDino')
...     ])
>>> 
>>> rdd.filter(lambda x: True if 'e' in x[0] else False).collect()
[('MechanicalKeyboards', 2, 'ForgetfulDoryFish'), ('MechanicalKeyboards', 1, 'cheshire26'), ('MechanicalKeyboards', 1, 'Sygaldry'),     ('MechanicalKeyboards', 1, 'Sygaldry'), ('MechanicalKeyboards', 1, 'DzyDzyDino')]
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52576413

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档