我正在从Excel电子表格中读取数据,我可以使用下面的方法将结果缩小到特定的日期范围。如您所见,它只返回与我规定的日期范围标准相匹配的结果,并返回三列中的每一列的信息:“询问接收日期”、"Office“和"LocationType”。但是,我希望做的也是计算结果"office“列中存在的每个唯一值的总数。例如,我需要在我的电子表格中发现,对于小于或等于2021-04-04的所有数据,有以下计数: Central = 18,Central West = 12,East = 5,South =3
如果我使用的是很好的老式SQL查询语言,我可以使用一个命令,类似于:“从2021_AutoReport.xlsx中选择‘<=’,‘查询接收日期’<= '2021-04-04',连接SUM(中央),SUM(中西部),SUM(南方),SUM(东方)……我不是SQL查询专家,但希望您了解我正在做什么,并建议如何使用数据查询?非常感谢您的帮助!”
关于我的例子,far....just需要知道如何回答我的问题:
df =pd.read_excel("2021_AutoReport.xlsx")
myfilteredInfo= df[df['Date of inquiry Receipt'] <= '2021-04-04']
print(myfilteredInfo).结果:
Date of inquiry Receipt Office LocationType
2 2021-01-04 Central Laboratory
3 2021-02-23 Central Farm
4 2021-02-24 Central Laboratory
5 2021-02-24 Central Laboratory
6 2021-02-24 Central Laboratory
7 2021-02-26 Central West SalesOffice
8 2021-03-02 Central Laboratory
9 2021-03-03 Central West Other
10 2021-03-03 Central West SalesOffice
11 2021-03-04 Central Laboratory
12 2021-03-04 Central Laboratory
13 2021-03-08 Central Laboratory
14 2021-03-08 South Other
15 2021-03-09 Central West Laboratory
16 2021-03-11 Central Laboratory
17 2021-03-11 Central West Other
18 2021-03-16 East Laboratory
19 2021-03-16 East Laboratory
20 2021-03-19 Central West Other
21 2021-03-19 Central West Laboratory
22 2021-03-20 East Laboratory
23 2021-03-22 Central Laboratory
24 2021-03-22 East Laboratory
25 2021-03-23 Central Other
26 2021-03-24 Central Laboratory
27 2021-03-24 Central West Laboratory
28 2021-03-25 Central Other
29 2021-03-25 Central West Other
30 2021-03-25 Central Laboratory
31 2021-03-26 South Laboratory
32 2021-03-30 Central Other
33 2021-03-31 Central West Laboratory
34 2021-04-01 South Other
35 2021-04-01 Central West SalesOffice
36 2021-04-01 Central Laboratory
37 2021-04-01 East SalesOffice
38 2021-04-01 Central Laboratory
39 2021-04-01 Central West Laboratory 发布于 2021-06-08 21:10:06
..。计算结果"office“列中存在的每个唯一值的总数.
这将完成以下工作:
>>> df.groupby('office').agg(numer_unique=('LocationType', 'count')发布于 2021-06-08 21:11:47
对所需的列( value_counts )使用文档方法(Office):
myfilteredInfo['Office'].value_counts()https://stackoverflow.com/questions/67894532
复制相似问题