文章/答案/技术大牛

发布

社区首页 >问答首页 >比较熊猫中列行列表和使用过滤器的情况

问比较熊猫中列行列表和使用过滤器的情况
EN

Stack Overflow用户

提问于 2018-06-21 12:40:19

回答 2查看 38关注 0票数 1

sales = [(3588, [1,2,3,4,5,6], [1,38,9,2,18,5]),
         (3588, [2,5,7], [1,2,4,8,14]),
         (3588, [3,10,13], [1,3,4,6,12]),
         (3588, [4,5,61], [1,2,3,4,11,5]),
         (3590, [3,5,6,1,21], [3,10,13]),
         (3590, [8,1,2,4,6,9], [2,5,7]),
         (3591, [1,2,4,5,13], [1,2,3,4,5,6])
        ]
labels = ['goods_id', 'properties_id_x', 'properties_id_y']

df = pd.DataFrame.from_records(sales, columns=labels)

df
Out[4]:
goods_id    properties_id_x properties_id_y
0   3588    [1, 2, 3, 4, 5, 6]  [1, 38, 9, 2, 18, 5]
1   3588    [2, 5, 7]   [1, 2, 4, 8, 14]
2   3588    [3, 10, 13] [1, 3, 4, 6, 12]
3   3588    [4, 5, 61]  [1, 2, 3, 4, 11, 5]
4   3590    [3, 5, 6, 1, 21]    [3, 10, 13]
5   3590    [8, 1, 2, 4, 6, 9]  [2, 5, 7]
6   3591    [1, 2, 4, 5, 13]    [1, 2, 3, 4, 5, 6]

具有商品及其特性的df。需要逐行比较properties_id_x和properties_id_y，并且只返回列表中同时包含"1"和"5"的行。不知道该怎么做。

期望输出：

0   3588    [1, 2, 3, 4, 5, 6]  [1, 38, 9, 2, 18, 5]
6   3591    [1, 2, 4, 5, 13]    [1, 2, 3, 4, 5, 6]

python-3.x

pandas

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-06-21 12:49:06

选项1:

In [176]: mask  = df.apply(lambda r: {1,5} <= (set(r['properties_id_x']) & set(r['properties_id_y'])), axis=1)

In [177]: mask
Out[177]:
0     True
1    False
2    False
3    False
4    False
5    False
6     True
dtype: bool

In [178]: df[mask]
Out[178]:
   goods_id     properties_id_x       properties_id_y
0      3588  [1, 2, 3, 4, 5, 6]  [1, 38, 9, 2, 18, 5]
6      3591    [1, 2, 4, 5, 13]    [1, 2, 3, 4, 5, 6]

备选方案2:

In [183]: mask = df.properties_id_x.map(lambda x: {1,5} <= set(x)) & df.properties_id_y.map(lambda x: {1,5} <= set(x))

In [184]: df[mask]
Out[184]:
   goods_id     properties_id_x       properties_id_y
0      3588  [1, 2, 3, 4, 5, 6]  [1, 38, 9, 2, 18, 5]
6      3591    [1, 2, 4, 5, 13]    [1, 2, 3, 4, 5, 6]

票数 2

Stack Overflow用户

发布于 2018-06-21 12:58:52

您还可以使用dict交集。

df["intersect"] = df.apply(lambda x: set(x["properties_id_x"]).intersection(x["properties_id_y"]), axis=1)
df[df["intersect"].map(lambda x: (1 in x) and (5 in x))]

>> 0   3588    [1, 2, 3, 4, 5, 6]  [1, 38, 9, 2, 18, 5]
>> 6   3591    [1, 2, 4, 5, 13]    [1, 2, 3, 4, 5, 6]

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/50968827

复制

相似问题

问比较熊猫中列行列表和使用过滤器的情况
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问比较熊猫中列行列表和使用过滤器的情况EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问比较熊猫中列行列表和使用过滤器的情况
EN