数据集:每年售出的前50部小说体裁专栏:小说,非小说(只有两个独特的价值)
我如何总结数据,以便我得到一个表作者的名字,以及他们写的小说和非小说书籍的数量,在两个不同的列?
以下是dataset的最小化版本:
“{‘Name’:{0:‘10天绿色Smoothie Cleanse',1:'11/22/63:一本小说’,2:”12条生命规则:解决混乱的良药“},
‘’:{0:'JJ Smith',1:'Stephen‘,2:'Jordan B. Peterson'},
‘用户评级’:{0: 4.7,1: 4.6,2: 4.7},
‘Review’:{0:'17,350',1:'2,052',2:'18,979'},
'Price':{0:'$8.00',1:'$22.00',2:'$15.00'}
'Price_r':{0:‘8’,1:'$22',2:'$15'},
‘年度’:{0: 2016,1: 2011,2: 2018},
‘:{0:’非虚构‘,1:’虚构‘,2:’非虚构‘}}“
df.groupby(['Author']).Genre.value_counts().sort_values(ascending = False)我试过用“组按”,但没有为小说和非小说获得精美版专栏。
发布于 2022-09-09 13:19:46
我们没有专栏的名字,但据我所知,这样的东西应该可以完成以下工作:
df.groupby(["author", "genre"]).count()或者(将“作者”和“体裁”作为列返回,而不是将它们放在索引中):
df.groupby(["author", "genre"]).count().reset_index()https://stackoverflow.com/questions/73662752
复制相似问题