我正在寻找一种基于twitter提要的hashtag聚类算法,在该算法中,hashtag不会严格地分配给一个集群。
非常简单的例子:
#vegetable
我想得到的结果是:
食品#vegetable
当然,在现实中,我可以有成千上万的提要和数千种可能的标签。
我尝试了各种方法在科学学习(k-均值,光谱聚类,聚类)使用相似矩阵,如:
#food | #vegetable | #fruit |
#food 1 | 1/2 | 1/2 |
#vegetable 1/2 | 1 | 0 |
#fruit 1/2 | 0 | 1 |所有这些算法都可以工作,但它们会创建不相交的集群(每个散列标记只属于一个集群)。
发布于 2019-10-09 14:23:45
,
。
https://stackoverflow.com/questions/58181300
复制相似问题