问熊猫群用第二列分词，然后分组求和
EN

Stack Overflow用户

提问于 2019-09-20 18:51:11

回答 1查看 32关注 0票数 0

我有一只有两栏的熊猫数据。report_tags是逗号分隔的单词，t_f是表示是或否的标志(1或0)。我想用t_f把这些逗号分隔开的单词和组分开。然后将tag/t_f分组相加到一个名为count的新列中

df 
    report_tags             t_f
0   bec,eac,fbi,ic3,scam    1
1   dlink,router,wifi       0
2   adobe                   0
3   bec, fbi                1
4   bec, fbi, scam          0

期望产出：

df2
   tag    t_f   count
0  bec    1     2
1  eac    1     1
2  fbi    1     2
3  ic3    1     1
4  scam   1     1
5  dlink  0     1
6  router 0     1
7  wifi   0     1
8  adobe  0     1
9  bec    0     1
10 fbi    0     1
11 scam   0     1

python

pandas

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-09-20 18:59:06

使用str.split + explode

k = dict(sort=False)

(df.set_index('t_f')['report_tags']
  .str.split(r',\s*').explode()
  .groupby(level=0, **k).value_counts(**k)
  .rename('count').reset_index())

    t_f report_tags  count
0     1         bec      2
1     1         eac      1
2     1         fbi      2
3     1         ic3      1
4     1        scam      1
5     0       adobe      1
6     0         bec      1
7     0       dlink      1
8     0         fbi      1
9     0      router      1
10    0        scam      1
11    0        wifi      1

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/58033792

复制

相似问题

问熊猫群用第二列分词，然后分组求和
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问熊猫群用第二列分词，然后分组求和EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问熊猫群用第二列分词，然后分组求和
EN