我把这个推特语料库变成了熊猫数据框架,我试图找到那些没有英文的推文,并把它们从数据框架中删除,所以我就这么做了:
for j in range(0,150):
if not wordnet.synsets(df.i[j]):#Comparing if word is non-English
df.drop(j)
print(df.shape)但我检查了形状,没有掉下来。我是使用了drop函数错误,还是需要跟踪行的索引?
发布于 2015-08-06 21:38:20
这是因为df.drop()返回一个副本,而不是修改原始数据。尝试设置inplace=True
for j in range(0,150):
if not wordnet.synsets(df.i[j]):#Comparing if word is non-English
df.drop(j, inplace=True)
print(df.shape)https://stackoverflow.com/questions/31866196
复制相似问题