通过定义主题来定义语料库和字典以构建LDA模型时,如何区分主题关键字
它在给出一个明确的主题编号的同时工作,但我希望它被迭代。
准备词典和语料库
from gensim import corpora
dictionary = corpora.Dictionary(doc_clean)
corpus = [dictionary.doc2bow(doc) for doc in doc_clean]构建LDA模型
lda_model = gensim.models.ldamodel.LdaModel(corpus = corpus , id2word=dictionary , num_topics=10 , random_state=100, update_every=1 , chunksize=100 , passes=10 , alpha='auto' , per_word_topics=True)打印主题中的关键字
topics = print(lda_model.print_topic(6))
doc_lda = lda_model[corpus]我想知道如何迭代主题,而不是每次手动给出主题编号
发布于 2019-06-17 20:25:21
如果我没理解错你的要求,你只需要:
topics = []
num_topics=10
for i in range((num_topics)):
topics.append(lda_model.print_topic(i+1))https://stackoverflow.com/questions/56630600
复制相似问题