首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >gensim生成LSI模型导致"Python停止工作“

gensim生成LSI模型导致"Python停止工作“
EN

Stack Overflow用户
提问于 2016-10-23 17:23:45
回答 1查看 665关注 0票数 1

因此,我试图使用gensim与corpus_lsi一起生成教程中的LSI模型。

我从我自己制作的语料库和字典开始。文档列表太小(9行=9文档),这是gensim教程中提供的示例列表

但是,pythos在到达生成LSI_model的行时就会崩溃。您可以在下面看到我的代码以及生成的输出

代码语言:javascript
复制
#!/usr/bin/env python
import os
from gensim import corpora, models, similarities
import logging

#logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)

if __name__ == '__main__':
    if (os.path.exists("tmp\dictionary.dict")):
        dictionary = corpora.Dictionary.load('tmp\dictionary.dict')
        corpus = corpora.MmCorpus('tmp\corpus.mm')
        print("Used files generated Dataset Generator")
    else:
        print("Please run dataset generator")

print ("generating tf-idf model ...")
tfidf = models.TfidfModel(corpus)   # Generate tfidf matrix (tf-idf model)
print ("generating corpus_tf-idf model ...")
corpus_tfidf = tfidf[corpus]    #use the model to transform vectors

print ("generating LSI model ...")
lsi = models.LsiModel(corpus_tfidf, id2word=dictionary, num_topics=2) # initialize an LSI transformation
print ("generating corpus_lsi model ...")
corpus_lsi = lsi[corpus_tfidf] # create a double wrapper over the original corpus: bow->tfidf->fold-in-lsi

lsi.print_topics(2)

输出

代码语言:javascript
复制
Used files generated Dataset Generator
generating tf-idf model ...
generating corpus_tf-idf model ...
generating LSI model ...

在打印“生成LSI模型”之后,它崩溃了。

有什么建议吗?

其他我试过的东西

  • 将python版本更改为python2.6
  • 移除gensim并从github重新安装它(而不是conda)
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-11-04 16:05:48

问题似乎是教程中使用的函数(可能是降级或其他什么的)。

所以我改变了路线

代码语言:javascript
复制
lsi = models.LsiModel(corpus_tfidf, id2word=dictionary, num_topics=2) # initialize an LSI transformation

代码语言:javascript
复制
lsi = LsiModel(corpus_tfidf,num_topics=2)

它真的很好用

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40205725

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档