如何使用pandas轻松应用100个值的多个过滤器?有两列(列/列2)和500000行。我的目标是:在sample.xlsx文件中找到一些值,如value-1、value-2等(应该包含所有这些值)。然后将column2中的唯一值提取到另一个xlsx文件中。
import pandas as pd
df=pd.read_excel('sample.xlsx')
filtered_list = df[(df['column']=='value-1')|
(df['column']=='value-2')]
(df['column']=='value-3')]
.......
(df['column']=='value-100')]
print(filtered_list) list = ['value-1', 'value-2', ..., 'value-100']
**Sample Dataset**
column column2
value-1 gene1
value-2 gene1
value-3 gene2
value-4 gene2
value-5 gene2
..... ....
value-100 gene3
value-102 gene3
value-105 gene4**1. Desired Output**
column column2
value-1 gene1
value-2 gene1
value-3 gene2
value-4 gene2
value-5 gene2
..... ....
value-100 gene3**2. Desired Output**
column2
gene1
gene2
gene3@domiziano
发布于 2021-05-05 21:32:01
如果你有一个你想要的所有值的列表,你可以这样做
list = ['value-1', 'value-2', ..., 'value-100']
filtered_list = df[df['column'].isin(list)]然后查看来自column2的所有唯一值
filtered_list['column2'].unique()https://stackoverflow.com/questions/67402228
复制相似问题