首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在Gensim的LSI模型中获得主题评分?

如何在Gensim的LSI模型中获得主题评分?
EN

Stack Overflow用户
提问于 2013-10-29 08:15:26
回答 1查看 1.5K关注 0票数 1

我在gensim中使用LsiModel对10000封邮件的主题进行建模。我能够得到每个主题的单词和单词分数,并将它们存储在一个文件中。我尝试过使用print_topics()show_topics(),但两者都只返回与这些单词相关的单词&得分。但是我也需要它输出到日志文件的主题评分,我希望变量中有这些值。与下面的示例日志输出类似:

代码语言:javascript
复制
2010-11-03 16:08:27,602 : INFO : topic #0(200.990): -0.475*"delete" + -0.383*"deletion" + -0.275*"debate" + -0.223*"comments" + -0.220*"edits" + -0.213*"modify" + -0.208*"appropriate" + -0.194*"subsequent" + -0.155*"wp" + -0.117*"notability"
2010-11-03 16:08:27,626 : INFO : topic #1(143.129): -0.320*"diff" + -0.305*"link" + -0.199*"image" + -0.171*"www" + -0.162*"user" + 0.149*"delete" + -0.147*"undo" + -0.144*"contribs" + -0.122*"album" + 0.113*"deletion"
2010-11-03 16:08:27,651 : INFO : topic #2(135.665): -0.437*"diff" + -0.400*"link" + -0.202*"undo" + -0.192*"user" + -0.182*"www" + -0.176*"contribs" + 0.168*"image" + -0.109*"added" + 0.106*"album" + 0.097*"copyright"
2010-11-03 16:08:27,677 : INFO : topic #3(125.027): -0.354*"image" + 0.239*"age" + 0.218*"median" + -0.213*"copyright" + 0.204*"population" + -0.195*"fair" + 0.195*"income" + 0.167*"census" + 0.165*"km" + 0.162*"households"
2010-11-03 16:08:27,701 : INFO : topic #4(116.927): -0.307*"image" + 0.195*"players" + 0.184*"median" + -0.184*"copyright" + -0.181*"age" + -0.167*"fair" + -0.162*"income" + -0.151*"population" + -0.136*"households" + -0.134*"census"

我需要这些分数在一个变量中。

代码语言:javascript
复制
topic #0 : 200.990 
topic #1 : 143.129
topic #2 : 135.665
topic #3 : 125.027
topic #4 : 116.927

包中是否有获得这些输出的方法?请帮帮忙。

EN

回答 1

Stack Overflow用户

发布于 2013-12-09 19:40:18

是。这些是与每个因素相关联的奇异值。

你可以从model.projection.s那里得到它们。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/19652908

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档