我有以下代码片段
genome_data = pd.read_csv('../genome')
genome_data_columns = genome_data.columns
genPredict = genome_data[genome_data_columns[genome_data_columns != 'Geuvadis']]这会删除列Geuvadis,有没有一种方法可以包含多个列?
发布于 2020-06-16 06:46:23
对你来说,一开始不读它们是可以的吗?
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
read_csv中的“DataFrame”选项允许您指定要包含在usecols中的数据列。
Venkatesh-PrasadRanganath是如何删除多列的正确答案。
但是,如果您希望避免将不会使用的数据读取到内存中,则可以使用genome_data = pd.read_csv('../genome',usecols="only","required","columns“)语法。
发布于 2020-06-16 07:15:29
你可以像genome_data.drop(['Geuvadis', 'C2', ...], axis=1)一样使用DataFrame.drop。
发布于 2020-06-16 06:46:38
我认为@Venkatesh-PrasadRanganath的答案更好,但对你的尝试采取类似的方法,我会这样做:
使用columns.to_list()'
list(set() - set())
genome_data = pd.read_csv('../genome') all_genome_data_columns = genome_data.columns.to_list() excluded_genome_data_columns = 'a','b','c‘#在此处键入要排除的列。genome_data_columns = list(set(all_genome_data_columns) - set(excluded_genome_data_columns)) genPredict =list
https://stackoverflow.com/questions/62398120
复制相似问题