首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >gensim LDA训练

gensim LDA训练
EN

Stack Overflow用户
提问于 2021-03-11 22:25:55
回答 1查看 103关注 0票数 0

我正在为一个项目使用gensim LDA模型。我似乎找不到合适的题目。我的问题是,可以肯定的是,每次我训练模特的时候都会重新开始,对吧?例如,我尝试了47个主题,结果很糟糕;然后我回到单元格,更改47到80个主题,然后再运行它。它完全开始了一次新的培训,抹去了它从47个主题中学到的东西,对吗?

我与LDA的结果很糟糕,相似度达到了100%或0%,而且我的参数调整也有问题。LSI给了我很好的结果。谢谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-03-18 08:33:32

是的,每次你训练LDA,它都会忘记它到目前为止学到的东西。

一些建议和评论可能会帮助你获得更好的结果:

  • 确保您已经对文本进行了适当的预处理。这通常包括删除标点符号和数字,删除频繁或罕见的断句和单词,(可选)对文本进行修饰。预处理取决于文本的语言和域。
  • 关于超级参数,您可以对alpha和beta使用“自动”模式,让模型学习alpha和beta的最佳值。如果您想要修复它们,通常建议值低于1。Check this
  • LDA是一个概率模型,这意味着如果用相同的超参数重新训练它,每次都会得到不同的结果。
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66591464

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档