除了nltk附带的语料库之外,我还想用我自己的语料库来训练它,该语料库遵循相同的词性规则。如何找到它正在使用的语料库,以及如何添加我自己的语料库(另外,不是作为替代)?
编辑:这里是我目前正在使用的代码:
inpy = raw_input("$")
text = nltk.word_tokenize(inpy)
d = nltk.pos_tag(text)发布于 2015-03-11 20:30:03
NLTK有大量不同的语料库。如果你能更详细地说明你想要扩充的语料库,那会有帮助的。棕色语料库是NLTK的主要英语词性语料库。也见http://www.nltk.org/book/ch05.html以及语料库和数据/
https://stackoverflow.com/questions/28996432
复制相似问题