首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >TF-国防军矩阵上的奇异值计算

TF-国防军矩阵上的奇异值计算
EN

Stack Overflow用户
提问于 2016-12-25 10:40:43
回答 1查看 2.7K关注 0票数 3

我想在TF矩阵上进行奇异值分解。但是TF-国防军矩阵给了我这样的东西(术语指数,分数):

代码语言:javascript
复制
[(1,0.2) , (2,0.3) , (6,0.1) ...]
[(3,0.2) , (5,0.3) , (10,0.1) ...]

因此,代码u,s,v = svd(corpus_tfidf)将无法在其上工作。我想要一个只有分数的TF-国防军矩阵,而不是术语索引。

我这样计算过TF-国防军:

代码语言:javascript
复制
tfidf = models.TfidfModel(corpus)
corpus_tfidf=tfidf[corpus]
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-12-25 11:46:56

如果使用gensim生成tfidf,则可以使用matutils将tfidf表示转换为稠密的numpy ndarray,反之亦然。

代码语言:javascript
复制
from gensim import matutils
tfidf_dense = matutils.corpus2dense(corpus_tfidf, num_terms).T

其中,num_terms是您的语料库中的一些独特术语。可以这样计算:

代码语言:javascript
复制
num_terms = len(corpus_tfidf.obj.idfs)
票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41320433

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档