首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何从df中查找搜索列表中所有元素都存在的行?

如何从df中查找搜索列表中所有元素都存在的行?
EN

Stack Overflow用户
提问于 2022-04-14 13:27:50
回答 1查看 18关注 0票数 0

我有一个df,它包含列、产品id和产品名称。产品名称列被标记化并以列表格式显示。例如:

代码语言:javascript
复制
Product id  Product name
1            [land, cruiser]
1            [land, cruiser]
1            [land, cruiser, toyota]
1            [land, cruiser]
1            [land, toyota]

search_word = [land, cruiser]和我希望选择search_word中所有元素都存在的所有行。所以,结果应该是

代码语言:javascript
复制
     Product id  Product name
    1            [land, cruiser]
    1            [land, cruiser]
    1            [land, cruiser]

目前,我编写了以下代码:

代码语言:javascript
复制
has_all = data[
        data['Product name'].apply(lambda x: np.all([*map(lambda l: l in x, search_words)]))]

如何加快这一行(大约4.2行)?在这种情况下,使用re库作为列表工作更快,还是作为字符串使用?

EN

回答 1

Stack Overflow用户

发布于 2022-04-14 13:36:59

您可以使用set操作和列表理解。

假设这一输入:

代码语言:javascript
复制
df = pd.DataFrame({'Product id': [1, 1, 1, 1, 1],
                   'Product name': [['land', 'cruiser'],
                                    ['land', 'cruiser'],
                                    ['land', 'cruiser', 'toyota'],
                                    ['land', 'cruiser'],
                                    ['land', 'toyota']]})

# use a set instead of a list!
search_word = set(['land', 'cruiser'])

您可以使用:

代码语言:javascript
复制
df2 = df[[search_word == set(x) for x in df['Product name']]]

产出:

代码语言:javascript
复制
   Product id     Product name
0           1  [land, cruiser]
1           1  [land, cruiser]
3           1  [land, cruiser]
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71872431

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档