我试图在语料库中找到最重要的单词,根据他们的TF-以色列国防军得分。
一直跟随在https://radimrehurek.com/gensim/tut2.html的例子。基于
>>> for doc in corpus_tfidf:
... print(doc)TF-以色列国防军的分数在每次迭代中都会被更新.例如,
所以我现在得到的是每一个单词的最终TF-以色列国防军得分,
tfidf = gensim.models.tfidfmodel.TfidfModel(corpus)
corpus_tfidf = tfidf[corpus]
d = {}
for doc in corpus_tfidf:
for id, value in doc:
word = dictionary.get(id)
d[word] = value有更好的办法吗?
提前谢谢。
发布于 2016-05-03 05:52:54
使用字典理解如何?
d = {dictionary.get(id): value for doc in corpus_tfidf for id, value in doc}https://stackoverflow.com/questions/36653882
复制相似问题