我知道当你导入所有你能做的事情的时候,你会想像双星的nltk.bigrams(nltk.corpus.brown.words()和三元的nltk.trigrams(nltk.corpus.brown.words(),但是你怎么做四克呢?
我见过其他的方法,但它们都是通过“字符串”或他们自己编写的文本来完成的。你是如何使用nltk.corpus.brown做到这一点的?是否必须将其转换为字符串?如果是,如何转换?
发布于 2021-11-20 19:36:26
要获取n个项目,可以使用nltk.ngrams(),并将要获取的数量作为第二个参数。
在您的示例中,要获得四元组,可以使用nltk.ngrams(nltk.corpus.brown.words(), 4)
https://stackoverflow.com/questions/70049103
复制相似问题