首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何分析并计算列中字符串发生的次数?

如何分析并计算列中字符串发生的次数?
EN

Stack Overflow用户
提问于 2018-05-09 17:41:03
回答 3查看 136关注 0票数 0

我有一个python DataFrame,我想分析它。

代码语言:javascript
复制
columns=['User ID','Activity','Time Stamp','X-Axis','Y-Axis','Z-Axis']
input_data = pd.read_csv('walkingcupstairscdownstairs.txt',delimiter=',',names=columns)

输出如下:

Activity专栏中有几种活动,例如慢跑、跑步等,我想知道有多少次发生了慢跑或步行

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2018-05-09 17:44:18

试试value_counts

代码语言:javascript
复制
input_data.Activity.value_counts()

示例:

代码语言:javascript
复制
input_data = pd.DataFrame({'Activity': np.random.choice(['Jogging', 'walking'], 10), 
                           'x':np.random.randn(10)})

>>> input_data
  Activity         x
0  walking -0.318043
1  walking -0.590098
2  walking -0.146811
3  Jogging  0.530030
4  Jogging  0.292955
5  walking  0.872765
6  walking  1.028513
7  Jogging -1.465817
8  Jogging  0.981183
9  walking -2.780214

>>> input_data.Activity.value_counts()
walking    6
Jogging    4
Name: Activity, dtype: int64
票数 3
EN

Stack Overflow用户

发布于 2018-05-09 17:44:53

尝试使用numpy的独特功能:

代码语言:javascript
复制
import numpy as np
np.unique(input_data['Activity'].values, return_counts=True)
票数 1
EN

Stack Overflow用户

发布于 2018-05-09 17:45:00

使用input_data.Activity.value_counts()获取dataframe的活动列中的每个唯一值及其显示的总次数。

如果您想要更一般地描述唯一值、顶级值、出现值等的数量,可以使用input_data.describe()并查看活动列的结果。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50259187

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档