首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Pyspark:选择除特定列之外的所有列

Pyspark:选择除特定列之外的所有列
EN

Stack Overflow用户
提问于 2018-06-13 21:13:10
回答 2查看 30.2K关注 0票数 20

我在一个PySpark数据帧中有大量的列,比如说200列。我想选择除3-4列之外的所有列。如何选择此列,而不必手动键入要选择的所有列的名称?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-09-04 15:05:45

最后,我解决了以下问题:

  • Drop

df.drop('column_1', 'column_2', 'column_3')

  • Select

df.select([c for c in df.columns if c not in {'column_1', 'column_2', 'column_3'}])

票数 34
EN

Stack Overflow用户

发布于 2021-09-13 17:04:51

代码语言:javascript
复制
df.drop(*[cols for cols in [list of columns to drop]])

如果要删除列的列表很大,则非常有用。或者该列表是否可以通过编程方式派生。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50838199

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档