首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Gensim获取TF-国防军单词的分数

使用Gensim获取TF-国防军单词的分数
EN

Stack Overflow用户
提问于 2016-04-15 17:56:37
回答 1查看 9.5K关注 0票数 9

我试图在语料库中找到最重要的单词,根据他们的TF-以色列国防军得分。

一直跟随在https://radimrehurek.com/gensim/tut2.html的例子。基于

代码语言:javascript
复制
>>> for doc in corpus_tfidf:
...     print(doc)

TF-以色列国防军的分数在每次迭代中都会被更新.例如,

  • 单词0(基于https://radimrehurek.com/gensim/tut1.html的“计算机”),TF-以色列国防军得分为0.5773 (博士#1),0.4442 (博士#2)。
  • 单词10 (“图”)的TF-以色列国防军得分为0.7071 (博士#7),0.5080 (博士#8),0.4588 (博士#9)。

所以我现在得到的是每一个单词的最终TF-以色列国防军得分,

代码语言:javascript
复制
tfidf = gensim.models.tfidfmodel.TfidfModel(corpus)
corpus_tfidf = tfidf[corpus]
d = {}
for doc in corpus_tfidf:
    for id, value in doc:
        word = dictionary.get(id)
        d[word] = value

有更好的办法吗?

提前谢谢。

EN

回答 1

Stack Overflow用户

发布于 2016-05-03 05:52:54

使用字典理解如何?

代码语言:javascript
复制
d = {dictionary.get(id): value for doc in corpus_tfidf for id, value in doc}
票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36653882

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档