首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用HDBSCAN检索集群成员

使用HDBSCAN检索集群成员
EN

Stack Overflow用户
提问于 2019-11-19 16:20:13
回答 1查看 153关注 0票数 0

因此,我有一些字符串数据,对其进行一些操作,然后使用HDBSCAN创建集群:

代码语言:javascript
复制
textData = train['eudexHash'].apply(lambda x: str(x))
clusterer = hdbscan.HDBSCAN(min_cluster_size=5,
                            gen_min_span_tree=True,
                            prediction_data=True).fit(textData.values.reshape(-1,1))

现在,当我调用集群来使用approximate_predict进行预测时,我得到了以下结果:

代码语言:javascript
复制
>>>> hdbscan.approximate_predict(clusterer, testCase)
(array([113]), array([1.]))

甜的,看起来像是在预测新的情况,所以它认为新的字符串值对应于标签113。现在,如何找到标签/桶/集群中的其他成员?

干杯!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-11-19 16:28:11

如果您想找出您的培训数据中哪些是标签113的一部分,那么您可以这样做。

代码语言:javascript
复制
textdata_with_label_113 = textData[clusterer.labels_ == 113]
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58938577

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档