如果需要根据记录的最小值对其进行分组,请执行以下操作
df.sort_values(['price']).drop_duplicates(['SKU']).to_csv('Min_Prices.csv',sep=';',index=False)我得到了
id price editor
1 k1 8.0 ed2
2 k3 10.0 ed1
4 k2 10.5 ed1 但我有一列额外的可用性,如
id price availability editor
1 k1 8.0 0 ed2
2 k1 9.0 1 ed1
3 k1 9.5 1 ed3
4 k4 9.5 1 ed1
5 k4 9.0 0 ed2
6 k5 8.5 1 ed1
7 k5 7.8 0 ed2预期应该是
k1 9.0 ed1
k4 9.5 ed1
k5 8.5 ed1那么,如何才能得到值1的最小可用性。在初始公式中插入可用性的位置呢?
谢谢
发布于 2019-03-30 22:09:05
我相信你需要boolean indexing或DataFrame.query
df1 = df[df['availability'] == 1].sort_values(['price']).drop_duplicates(['id'])
#alternative
#df1 = df.query('availability == 1').sort_values(['price']).drop_duplicates(['id'])
print (df1)
id price availability editor
6 k5 8.5 1 ed1
2 k1 9.0 1 ed1
4 k4 9.5 1 ed1
df1.to_csv('Min_Prices.csv',sep=';',index=False)https://stackoverflow.com/questions/55436036
复制相似问题