通过使用条件从dataframe掩蔽某些行,我将使用:
df.loc[mask]
将掩码设置为条件(例如只选择在column_x中具有'y‘的行)本身,而不将掩码赋值给变量,我通常会这样做:
df[df['column_x'] == 'y']
但这让我想知道在这些情况下df.loc的实际用途是什么。我是搞错了,还是在这种情况下使用loc是多余的呢?
发布于 2022-11-04 19:37:05
熊猫很聪明,你指的是df[df['column_x'] == 'y'],基于布尔级数df['column_x'] == 'y'的长度,以及它的指数恰好与df的索引一致。这是语法糖。您可以想象,在这样的情况下,数据文件几乎是正方形的,而事情就会变得更加模糊。
.loc访问器是按行、列或两者访问数据的子集的一种正式且最不含糊的方式。
https://stackoverflow.com/questions/74322106
复制相似问题