我正在做一个社区级别的网络分析,我正在尝试检测我的网络中的社区。我用了三种不同的算法
(1)基于边缘间隔性的社区检测(Newman-Girvan) -检测到: 50个社区,模块化0.1
ceb <- cluster_edge_betweenness(net)
dendPlot(ceb, mode = "hclust")
plot(ceb, net, vertex.label = NA, edge.label = NA)(2)基于传播标签的社区检测-检测4个社区,模块化0.4
clp <- cluster_label_prop(net)
plot(clp, net, vertex.label = NA, edge.label = NA)(3)基于模块化贪婪优化的社区检测--检测5个社区,模块化
cfg <- cluster_fast_greedy(as.undirected(net))
plot(cfg, net, vertex.label = NA, edge.label = NA)在我的数据中,我有在5个不同部门工作的员工(节点)。有5个社区是有意义的,并且更高的模块化(我认为)表明它是比第一个结果(50个社区)更好的衡量标准。但我真的不确定如何解释如此不同的结果。有没有人能说点什么?非常感谢
发布于 2020-09-17 02:48:24
我不完全确定您在这里所问的是什么,但让我大致尝试一下。模块化分数反映了一个特定的聚类算法在对顶点进行聚类时的表现。产生具有较高模块化分数的聚类结构的聚类算法比那些产生较低模块化分数的聚类算法“更好”。如果同一个网络有三种不同的聚类算法,那么模块化得分最高的算法将是更好的选择,前提是它在概念上有意义。根据我的理解,图中的聚类算法是这样产生的,即它们为所讨论的网络生成具有该算法可能的最佳模块性分数的聚类结构。
https://stackoverflow.com/questions/63614380
复制相似问题