我试图找出更好的文本清洗方法,以解决荷兰NLP问题。我使用荷兰版本的pos标签和nltk删除停止词。但我没有得到想要的结果。
发布于 2019-12-23 08:10:23
你试过这种方法吗?
from nltk.util import ngrams
from nltk.corpus import alpino
print(alpino.words())
quadgrams=ngrams(alpino.words(),4)
for i in quadgrams:
print(i)https://stackoverflow.com/questions/59451941
复制相似问题