首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >BERTopic在similarity_threshold_merging上的误差

BERTopic在similarity_threshold_merging上的误差
EN

Stack Overflow用户
提问于 2022-06-11 16:18:27
回答 2查看 246关注 0票数 0

我试图在这里复制代码:https://www.atoti.io/articles/topic-modeling-on-twitter-using-sentence-bert/

但是当我到达创建BERTopic模型时

代码语言:javascript
复制
# Create BERTopic model
topic_model = BERTopic(top_n_words=20,
                       n_gram_range=(1,2), 
                       calculate_probabilities=True,
                       umap_model= umap_model,
                       hdbscan_model=hdbscan_model,
                       similarity_threshold_merging=0.5,
                       verbose=True)

它说__init__()得到了一个意想不到的关键字参数'similarity_threshold_merging‘

EN

回答 2

Stack Overflow用户

发布于 2022-06-11 16:23:56

BERTopic的可用参数是:

__init__(自我,语言=‘英语’,top_n_words=10,n_gram_range=(1,1),min_topic_size=10,nr_topics=None,low_memory=False,calculate_probabilities=False,diversity=None,seed_topic_list=None,embedding_model=None,umap_model=None,hdbscan_model=None,vectorizer_model=None,verbose=False)

删除BERTopic构造函数未提供的所有参数。

票数 0
EN

Stack Overflow用户

发布于 2022-08-05 01:34:20

你所引用的文章中,作者提到向BERTopic添加功能。您需要进行相同的修改或删除similarity_threshold_merging参数。

对附加特征的需要 为了适应我们的用例,我们稍微重新讨论了这个基于BERT语句的库,以便能够:

  • 合并具有用户定义阈值以上相似性的主题。
  • 提取与任何给定主题相关的最相关文档,这些特性在原始库中缺失。
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72585980

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档