首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >试图聚合已经聚合的数据的查询--不确定使用哪一种最佳方法

试图聚合已经聚合的数据的查询--不确定使用哪一种最佳方法
EN

Stack Overflow用户
提问于 2021-06-08 20:59:48
回答 2查看 36关注 0票数 0

我正在从Excel电子表格中读取数据,我可以使用下面的方法将结果缩小到特定的日期范围。如您所见,它只返回与我规定的日期范围标准相匹配的结果,并返回三列中的每一列的信息:“询问接收日期”、"Office“和"LocationType”。但是,我希望做的也是计算结果"office“列中存在的每个唯一值的总数。例如,我需要在我的电子表格中发现,对于小于或等于2021-04-04的所有数据,有以下计数: Central = 18,Central West = 12,East = 5,South =3

如果我使用的是很好的老式SQL查询语言,我可以使用一个命令,类似于:“从2021_AutoReport.xlsx中选择‘<=’,‘查询接收日期’<= '2021-04-04',连接SUM(中央),SUM(中西部),SUM(南方),SUM(东方)……我不是SQL查询专家,但希望您了解我正在做什么,并建议如何使用数据查询?非常感谢您的帮助!”

关于我的例子,far....just需要知道如何回答我的问题:

代码语言:javascript
复制
df =pd.read_excel("2021_AutoReport.xlsx")
myfilteredInfo= df[df['Date of inquiry Receipt'] <= '2021-04-04']
print(myfilteredInfo)

.结果:

代码语言:javascript
复制
 Date of inquiry Receipt          Office  LocationType
2               2021-01-04      Central   Laboratory  
3               2021-02-23      Central                 Farm   
4               2021-02-24      Central   Laboratory  
5               2021-02-24      Central   Laboratory  
6               2021-02-24      Central   Laboratory  
7               2021-02-26  Central West           SalesOffice   
8               2021-03-02      Central   Laboratory  
9               2021-03-03  Central West               Other   
10              2021-03-03  Central West           SalesOffice   
11              2021-03-04      Central   Laboratory  
12              2021-03-04      Central   Laboratory  
13              2021-03-08      Central   Laboratory  
14              2021-03-08           South               Other   
15              2021-03-09  Central West  Laboratory  
16              2021-03-11      Central   Laboratory  
17              2021-03-11  Central West               Other   
18              2021-03-16            East  Laboratory  
19              2021-03-16            East  Laboratory  
20              2021-03-19  Central West               Other   
21              2021-03-19  Central West  Laboratory  
22              2021-03-20            East  Laboratory  
23              2021-03-22      Central   Laboratory  
24              2021-03-22            East  Laboratory  
25              2021-03-23      Central                Other   
26              2021-03-24      Central   Laboratory  
27              2021-03-24  Central West  Laboratory  
28              2021-03-25      Central                Other   
29              2021-03-25  Central West               Other   
30              2021-03-25      Central   Laboratory  
31              2021-03-26           South  Laboratory  
32              2021-03-30      Central                Other   
33              2021-03-31  Central West  Laboratory  
34              2021-04-01           South               Other   
35              2021-04-01  Central West           SalesOffice   
36              2021-04-01      Central   Laboratory  
37              2021-04-01            East           SalesOffice   
38              2021-04-01      Central   Laboratory  
39              2021-04-01  Central West  Laboratory  
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-06-08 21:10:06

..。计算结果"office“列中存在的每个唯一值的总数.

这将完成以下工作:

代码语言:javascript
复制
>>> df.groupby('office').agg(numer_unique=('LocationType', 'count')
票数 0
EN

Stack Overflow用户

发布于 2021-06-08 21:11:47

对所需的列( value_counts )使用文档方法(Office):

代码语言:javascript
复制
myfilteredInfo['Office'].value_counts()
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67894532

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档