首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >python:和熊猫一起工作。获得计数

python:和熊猫一起工作。获得计数
EN

Stack Overflow用户
提问于 2014-03-04 16:30:18
回答 1查看 42关注 0票数 1

数据集看起来是这样的:

代码语言:javascript
复制
<link>, <type>

例如,类型可以是“types”、“no追随者”和"javascript“。

考虑到每个链接可能多次出现在数据集中,我需要以以下方式获得结果

代码语言:javascript
复制
link, dofollow, nofollow, javascript
http://somelink.com, 10 (e.g. it appeared 10 times as dofollow), 0, 101
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-03-04 17:33:05

您可以按大小使用组:

代码语言:javascript
复制
In [11]: df = pd.DataFrame([['a_link', 'dofollow'], ['a_link', 'dofollow'], ['a_link', 'nofollow'], ['b_link', 'javascript']], columns=['link', 'type'])

In [12]: df
Out[12]: 
     link        type
0  a_link    dofollow
1  a_link    dofollow
2  a_link    nofollow
3  b_link  javascript

In [13]: df.groupby(['link', 'type']).size()
Out[13]: 
link    type      
a_link  dofollow      2
        nofollow      1
b_link  javascript    1
dtype: int64

现在,您打开第二级(类型)堆栈,使其成为一列并填充空白:

代码语言:javascript
复制
In [14]: df.groupby(['link', 'type']).size().unstack(1)
Out[14]: 
type    dofollow  javascript  nofollow
link                                  
a_link         2         NaN         1
b_link       NaN           1       NaN

In [15]: df.groupby(['link', 'type']).size().unstack(1).fillna(0)
Out[15]: 
type    dofollow  javascript  nofollow
link                                  
a_link         2           0         1
b_link         0           1         0
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/22177533

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档