首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从dataframe中删除多列

从dataframe中删除多列
EN

Stack Overflow用户
提问于 2020-06-16 06:38:10
回答 3查看 192关注 0票数 0

我有以下代码片段

代码语言:javascript
复制
genome_data = pd.read_csv('../genome')
genome_data_columns = genome_data.columns

genPredict = genome_data[genome_data_columns[genome_data_columns != 'Geuvadis']]

这会删除列Geuvadis,有没有一种方法可以包含多个列?

EN

回答 3

Stack Overflow用户

发布于 2020-06-16 06:46:23

对你来说,一开始不读它们是可以的吗?

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

read_csv中的“DataFrame”选项允许您指定要包含在usecols中的数据列。

Venkatesh-PrasadRanganath是如何删除多列的正确答案。

但是,如果您希望避免将不会使用的数据读取到内存中,则可以使用genome_data = pd.read_csv('../genome',usecols="only","required","columns“)语法。

票数 1
EN

Stack Overflow用户

发布于 2020-06-16 07:15:29

你可以像genome_data.drop(['Geuvadis', 'C2', ...], axis=1)一样使用DataFrame.drop

票数 1
EN

Stack Overflow用户

发布于 2020-06-16 06:46:38

我认为@Venkatesh-PrasadRanganath的答案更好,但对你的尝试采取类似的方法,我会这样做:

使用columns.to_list()'

  • Create a list to be excluded

  • Subtract要从完整列表中排除的列标识所有列,使用list(set() - set())

  • Select
  1. 标识剩余的列。

genome_data = pd.read_csv('../genome') all_genome_data_columns = genome_data.columns.to_list() excluded_genome_data_columns = 'a','b','c‘#在此处键入要排除的列。genome_data_columns = list(set(all_genome_data_columns) - set(excluded_genome_data_columns)) genPredict =list

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62398120

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档