首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >python:基于几个列过滤熊猫数据文件

python:基于几个列过滤熊猫数据文件
EN

Stack Overflow用户
提问于 2020-12-01 15:00:39
回答 1查看 29关注 0票数 0

我正在处理存储在熊猫数据文件中的数据集的分析,该数据集在我的Python程序中被定义为

代码语言:javascript
复制
df = pd.DataFrame(columns=["System","LogP", "Hb_acc", "Hb_donnors", "Weight"])

根据该表:前两列对应于系统的数量及其名称,第3-6列对应于为这些系统执行的测量:

代码语言:javascript
复制
        System    LogP Hb_acc Hb_donnors   Weight
0        cne_1  1.1732      3          1  263.405
1       cne_10  2.6639      2          0  197.237
2      cne_100 -0.2886      4          2  170.193
3     cne_1000  1.9644      5          1  304.709
4     cne_1001  1.4986      3          1  162.144
...        ...     ...    ...        ...      ...
1033   cne_995  3.0179      4          2  347.219
1034   cne_996  4.8419      6          2  407.495
1035   cne_997  3.3560      3          1  354.524
1036   cne_998  7.5465      4          2  635.316
1037   cne_999  3.3514      4          1  389.556

我需要过滤这1037行,只对所有列使用符合以下要求的行:

  • third_column (LogP),应该是<5
  • fouth_column (Hb_acc),应该是<10
  • fifth_column (Hb_donor),应该是<5
  • six_column (重量),应该是<500

F 211

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-12-01 22:52:01

您需要查看pandas.DataFrame.loc (https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.loc.html)方法。例如,您的第一个请求如下所示:

代码语言:javascript
复制
new_df = df.loc[df['LogP'] < 5]

虽然我还没有必要(到目前为止),但我敢打赌你可以把这些锁在一起,一举得到你想要的东西。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65254603

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档