首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于标签的重叠聚类(软聚类)

基于标签的重叠聚类(软聚类)
EN

Stack Overflow用户
提问于 2019-10-01 08:55:50
回答 1查看 263关注 0票数 1

我正在寻找一种基于twitter提要的hashtag聚类算法,在该算法中,hashtag不会严格地分配给一个集群。

非常简单的例子:

#vegetable

  • feed 2:#食品#vegetable

  • feed 3:#食品#水果

  • 饲料4:#食品#水果

我想得到的结果是:

食品#vegetable

  • cluster 2:#食品#水果

当然,在现实中,我可以有成千上万的提要和数千种可能的标签。

我尝试了各种方法在科学学习(k-均值,光谱聚类,聚类)使用相似矩阵,如:

代码语言:javascript
复制
               #food | #vegetable | #fruit |
#food            1   |    1/2     |   1/2  |
#vegetable      1/2  |     1      |    0   |
#fruit          1/2  |     0      |    1   |

所有这些算法都可以工作,但它们会创建不相交的集群(每个散列标记只属于一个集群)。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-10-09 14:23:45

  • 您可以考虑您的hashtag是一个描述,并在其上运行一个LDA算法。它将创建包含多个哈希标签的主题,每个哈希标签可以在多个主题中找到。

  • ,您可以从您的哈希标签中创建一个加权图。所有的哈希标签都是这个图的节点,当哈希标签出现在同一个提要中时,边会增加。从这个图中,您可以使用多个社区检测算法,该算法允许社区重叠(例如,单击)

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58181300

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档