我有一个python DataFrame,我想分析它。
columns=['User ID','Activity','Time Stamp','X-Axis','Y-Axis','Z-Axis']
input_data = pd.read_csv('walkingcupstairscdownstairs.txt',delimiter=',',names=columns)输出如下:

Activity专栏中有几种活动,例如慢跑、跑步等,我想知道有多少次发生了慢跑或步行
发布于 2018-05-09 17:44:18
input_data.Activity.value_counts()示例:
input_data = pd.DataFrame({'Activity': np.random.choice(['Jogging', 'walking'], 10),
'x':np.random.randn(10)})
>>> input_data
Activity x
0 walking -0.318043
1 walking -0.590098
2 walking -0.146811
3 Jogging 0.530030
4 Jogging 0.292955
5 walking 0.872765
6 walking 1.028513
7 Jogging -1.465817
8 Jogging 0.981183
9 walking -2.780214
>>> input_data.Activity.value_counts()
walking 6
Jogging 4
Name: Activity, dtype: int64发布于 2018-05-09 17:44:53
尝试使用numpy的独特功能:
import numpy as np
np.unique(input_data['Activity'].values, return_counts=True)发布于 2018-05-09 17:45:00
使用input_data.Activity.value_counts()获取dataframe的活动列中的每个唯一值及其显示的总次数。
如果您想要更一般地描述唯一值、顶级值、出现值等的数量,可以使用input_data.describe()并查看活动列的结果。
https://stackoverflow.com/questions/50259187
复制相似问题