我在一个PySpark数据帧中有大量的列,比如说200列。我想选择除3-4列之外的所有列。如何选择此列,而不必手动键入要选择的所有列的名称?
发布于 2018-09-04 15:05:45
最后,我解决了以下问题:
df.drop('column_1', 'column_2', 'column_3')
df.select([c for c in df.columns if c not in {'column_1', 'column_2', 'column_3'}])
发布于 2021-09-13 17:04:51
df.drop(*[cols for cols in [list of columns to drop]])如果要删除列的列表很大,则非常有用。或者该列表是否可以通过编程方式派生。
https://stackoverflow.com/questions/50838199
复制相似问题