BerTopic模型得出了以下主题:
正如您可以从上面看到的,模型被细化,以生成较小的异常值'-1‘,其计数为3,并出现在最后。
在可视化每堂课主题的同时,
topic_model.visualize_topics_per_class(topics_per_class)
生成了下面的交互式可视化,但是它忽略了0th索引,确切地说是主题0。全局主题表示从1, 2, 3, 4, 5, 6, -1显示
0th
1, 2, 3, 4, 5, 6, -1
BerTopic的设计方式是否总是假定第一个索引将是一个异常值(-1),并盲目地消除它?
-1
生成的主题是否总是根据计数大小访问,可能是按降序进行的?
发布于 2022-08-11 02:14:49
这个问题也发表在BerTopic github论坛上,作者本人也有这样的回应,
通过设置top_n_topics=None,可以在可视化时查看所有主题以及0th索引,
top_n_topics=None
topic_model.visualize_topics_per_class(topics_per_class, top_n_topics=None)
https://stackoverflow.com/questions/73301384
相似问题