文章/答案/技术大牛

发布

社区首页 >问答首页 >如何选择指定范围内的数据框列值？

问如何选择指定范围内的数据框列值？
EN

Stack Overflow用户

提问于 2020-07-12 07:53:29

回答 2查看 80关注 0票数 1

这是我的代码：

df = pd.read_csv("/content/Intel_AI4Y/My Drive/Intel_AI4Y_Colab/Module_16/data/Students_Score1.csv")

names = ["Student No." ,"Hours spent studying in a day", "Mathematics score", "English score","Science score"]

df.columns = names

Mathematics_score = df.iloc[:, 0]

df = df[~df.iloc[:, 0].between(100, 0, inclusive=False)]

print(df.describe())

print (df.info())

我正在尝试从数学分数中删除错误的数据，数值低于0或高于100。我不确定我该如何编写代码。有人能帮上忙吗？

pandas

numpy

matplotlib

python

回答 2

Stack Overflow用户

发布于 2020-07-12 11:15:49

df = df[~df.iloc[:, 0].between(100, 0, inclusive=False)]几乎是correct
pandas.Series.between需要一个左右边界，应该是0，>=100.
To是not，所以实际上df.iloc[:, 0].between(0, 100, inclusive=False)返回0到100之间的所有内容，但是~df.iloc[:, 0].between(0, 100, inclusive=False)返回值<=0和Pandas: Selection by position返回值在0到100之间，请使用Pandas: Indexing and selecting data
See查看~df.iloc[:, 0].between(0, 100, inclusive=False)Pandas: Selection by position以了解.iloc的正确用法。df.iloc[:, 0]表示您已经选择了所有行、:和索引0处的列。我的样本数据只有一列，所以索引为0。您需要验证感兴趣的列的索引。

import pandas as pd
import numpy as np

# sample dataframe
np.random.seed(100)
df = pd.DataFrame({'values': [np.random.randint(-100, 200) for _ in range(500)]})

# values between 0 and 100
df[df.iloc[:, 0].between(0, 100, inclusive=False)]

 values
     43
     37
     55
     41
     35

# values <=0 or >=100
df[~df.iloc[:, 0].between(0, 100, inclusive=False)]

 values
    -92
    180
    -21
    -47
    -34

票数 1

Stack Overflow用户

发布于 2020-07-12 08:02:28

因为你的数据帧有标题。我真的建议使用遮罩滤镜，如下所示。

df = df[(df['Mathematics score'] > 0) & (df['Mathematics score'] < 100)]

正如@Trenton McKinney所建议的那样，使用iloc有时确实更容易，因为您不必键入列名。

因此，在您的示例中，因为列Mathematics score是第三个列，所以您应该这样做：

df[~df.iloc[:, 2].between(0, 100, inclusive=False)]

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/62855766

复制

相似问题

问如何选择指定范围内的数据框列值？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何选择指定范围内的数据框列值？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何选择指定范围内的数据框列值？
EN