我已经通过gensim建立了一个主题模型,我也能够用pyLDAvis分析它。然而,我想知道是否有可能可视化整个数据收集时间内主题的分布。
结果应该是一个折线图,它以第一个月和主题的概率开始,以最后一个月结束。如果这也可以在一个图表中可视化3-5个主题,那就太好了。
发布于 2021-06-27 08:33:48
有一些主题模型,像DTM (Blei和Lafferty),eDTM (Dieng,Blei等人),(DTM =动态主题模型),以及topic over Time (Wang和McCallum),它们是时间主题模型,可以实现类似于你想要的东西。如果你有一个大型的数据集,这些模型就不太可行了,因为它们需要大量的时间来运行。在这种情况下,最好的办法是将数据集划分为多个时间段,并为每个时间段运行LDA。在规模上工作的好的时间主题模型是一个未解决的问题。
https://stackoverflow.com/questions/68119477
复制相似问题