问熊猫数据中含有非英语单词的行
EN

Stack Overflow用户

提问于 2015-08-06 21:34:45

回答 1查看 4.4K关注 0票数 0

我把这个推特语料库变成了熊猫数据框架，我试图找到那些没有英文的推文，并把它们从数据框架中删除，所以我就这么做了：

for j in range(0,150):
    if not wordnet.synsets(df.i[j]):#Comparing if word is non-English
           df.drop(j)

 print(df.shape)

但我检查了形状，没有掉下来。我是使用了drop函数错误，还是需要跟踪行的索引？

回答已采纳

发布于 2015-08-06 21:38:20

这是因为df.drop()返回一个副本，而不是修改原始数据。尝试设置inplace=True

for j in range(0,150):
    if not wordnet.synsets(df.i[j]):#Comparing if word is non-English
           df.drop(j, inplace=True)

print(df.shape)

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/31866196

复制

相似问题

问熊猫数据中含有非英语单词的行EN