我正在处理存储在熊猫数据文件中的数据集的分析,该数据集在我的Python程序中被定义为
df = pd.DataFrame(columns=["System","LogP", "Hb_acc", "Hb_donnors", "Weight"])根据该表:前两列对应于系统的数量及其名称,第3-6列对应于为这些系统执行的测量:
System LogP Hb_acc Hb_donnors Weight
0 cne_1 1.1732 3 1 263.405
1 cne_10 2.6639 2 0 197.237
2 cne_100 -0.2886 4 2 170.193
3 cne_1000 1.9644 5 1 304.709
4 cne_1001 1.4986 3 1 162.144
... ... ... ... ... ...
1033 cne_995 3.0179 4 2 347.219
1034 cne_996 4.8419 6 2 407.495
1035 cne_997 3.3560 3 1 354.524
1036 cne_998 7.5465 4 2 635.316
1037 cne_999 3.3514 4 1 389.556我需要过滤这1037行,只对所有列使用符合以下要求的行:
F 211
发布于 2020-12-01 22:52:01
您需要查看pandas.DataFrame.loc (https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.loc.html)方法。例如,您的第一个请求如下所示:
new_df = df.loc[df['LogP'] < 5]虽然我还没有必要(到目前为止),但我敢打赌你可以把这些锁在一起,一举得到你想要的东西。
https://stackoverflow.com/questions/65254603
复制相似问题