我对Python很陌生,我想弄清楚如何操作Pandas数据格式。我正在使用winemag-data-130 k-v2.csv数据集。感兴趣的领域有“乡村”、“省”、“酒厂”、“品种”。
我想做的第一件事是确定每个省的酿酒厂数量。我可以走到reviews_df.groupby(['country','province']).size()
但这给了我行数。(因此,如果酿酒厂生产3个品种,则为3种)。但是我想要类似于SQL中的count(distinct winery)。有什么建议吗?
发布于 2018-10-11 12:40:11
你需要的是nunique()
reviews_df.groupby(['country','province']).nunique()https://stackoverflow.com/questions/52760156
复制相似问题