文章/答案/技术大牛

发布

社区首页 >问答首页 >如果列中的所有标记都包含python中的from停止词列表，如何筛选行？

问如果列中的所有标记都包含python中的from停止词列表，如何筛选行？
EN

Stack Overflow用户

提问于 2020-03-23 09:14:56

回答 2查看 158关注 0票数 0

假设我有一个数据中心：

Sentences              Group
It is you                0
She likes flower         1
She hates gardening      2

以及一份停车名单：

from nltk.corpus import stopwords
stop_words = stopwords.words('english')

如果列df['Sentences']中的所有标记/单词都包含stop_words列表中的任何标记/单词，如何删除行。因此，我的结果应该是这样的：

Sentences              Group
She likes flower         1
She hates gardening      2

python

dataframe

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-03-23 09:31:10

可以用空格分隔列，然后比较列表：

df = df[~df['Sentences'].apply(lambda r: list(set(r.split(' ')).intersection(stop_words))!=[] )]

~的意思是“不包含”以下行。

票数 1

Stack Overflow用户

发布于 2020-03-23 09:58:54

这是我的解决方案：

filtered_df = df[~df['Sentences'].str.split().apply(lambda x: any(s for s in x if s in stop_words))]

先分句。然后检查句子中的任何单词是否也在你的stop_words中。如果其中有一个单词，any将返回True。我们用~来逆转这一点。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60810645

复制

相似问题

问如果列中的所有标记都包含python中的from停止词列表，如何筛选行？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如果列中的所有标记都包含python中的from停止词列表，如何筛选行？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如果列中的所有标记都包含python中的from停止词列表，如何筛选行？
EN