首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >创建仅包含组的最大公共配对的字典

创建仅包含组的最大公共配对的字典
EN

Stack Overflow用户
提问于 2019-03-06 04:45:09
回答 1查看 33关注 0票数 1

我想创建一个最大公共配对的字典-一个“协议”表。在找到协议时,是否可以将代码缩短一点?到目前为止,我真的不喜欢找到最大计数,然后在计数上进行匹配以找到“协议”。

代码语言:javascript
复制
import pandas as pd
from collections import defaultdict


df = pd.DataFrame({
    'id': ['A', 'A', 'B', 'B', 'B', 'B'],
    'value': [1, 1, 2, 2, 1, 2]})

df = df.groupby(["id","value"]).size().reset_index().rename(columns={0: "count"})
df["max_rank"] = df.groupby(["id"])["count"].transform("max")==df["count"]
df = df.loc[(df["max_rank"]==True)]

d = defaultdict(list)

for idx, row in df.iterrows():
    d[row['id']].append(row['value'])

d = [{k: v} for k, v in d.items()]

d

输出:[{'A':1},{'B':2}]

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-03-06 04:56:01

您可以构建一个将每个id映射到一个值列表的字典,然后使用collections.Counter.most_common方法获取每个id的最常用的值

代码语言:javascript
复制
from collections import Counter
d = {'id': ['A', 'A', 'B', 'B', 'B', 'B'], 'value': [1, 1, 2, 2, 1, 2]}
mapping = {}
for k, v in zip(d['id'], d['value']):
    mapping.setdefault(k, []).append(v)
print({k: Counter(l).most_common(1)[0][0] for k, l in mapping.items()})

这将输出以下内容:

代码语言:javascript
复制
{'A': 1, 'B': 2}
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55011279

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档