我想通过按字典格式的前2列分组来输出数据帧。这是我的数据框架:
COMUNIDAD PROVINCIA EMPLAZAMIENTO
0 ANDALUCIA ALMERIA ALMERIA
1 ANDALUCIA ALMERIA EJIDO, EL
2 ANDALUCIA ALMERIA HUERCAL OVERA
3 ANDALUCIA ALMERIA PECHINA
4 ANDALUCIA ALMERIA VELEZ BLANCO
... ... ... ...
246 VALENCIA VALENCIA COFRENTES
247 VALENCIA VALENCIA MONDUBER
248 VALENCIA VALENCIA ONTENIENTE
249 VALENCIA VALENCIA PICAYO
250 VALENCIA VALENCIA UTIEL我想要这个输出:
{
"ANDALUCIA":{
"ALMERIA":[
"ALMERIA",
"EJIDO, EL",
...
],
"CADIZ":[
"JEREZ DE LA FRONTERA",
...
]
},
"ARAGON":{
"HUESCA":[
"ARGUIS",
...
],
...
},
...
}通过熊猫实现这一目标的最好方法是什么?
发布于 2020-10-23 20:51:59
对列表使用GroupBy.agg,然后创建嵌套字典:
s = df.groupby(['COMUNIDAD','PROVINCIA'])['EMPLAZAMIENTO'].agg(list)
d = {level: s.xs(level).to_dict() for level in s.index.levels[0]}
print (d)
{'ANDALUCIA': {'ALMERIA': ['ALMERIA', 'EJIDO, EL',
'HUERCAL OVERA', 'PECHINA', 'VELEZ BLANCO']},
'VALENCIA': {'VALENCIA': ['COFRENTES', 'MONDUBER',
'ONTENIENTE', 'PICAYO', 'UTIEL']}}最后一次使用json:
import json
j = json.dumps(d)
print (j)
{"ANDALUCIA": {"ALMERIA": ["ALMERIA", "EJIDO, EL",
"HUERCAL OVERA", "PECHINA", "VELEZ BLANCO"]},
"VALENCIA": {"VALENCIA": ["COFRENTES", "MONDUBER",
"ONTENIENTE", "PICAYO", "UTIEL"]}}https://stackoverflow.com/questions/64500181
复制相似问题