我正在使用Python NLTK包从我的语料库生成2-gram和3-gram。但我找不到NLTK如何从语料库中生成它们。
我在这里找到了这个:An Introduction to N-grams: What Are They and Why Do We Need Them?,但我想知道是否有其他算法来寻找n-gram。NLTK是否使用本文中的算法来查找n元语法?
像往常一样,非常感谢你。
发布于 2020-01-30 06:56:53
您可以使用zip将句子中的单词对/三元组/n长度序列作为元组进行迭代。
for s in sentences:
for w1, w2 in zip(s, s[1:]):
bigram = w1, w2https://stackoverflow.com/questions/59688237
复制相似问题