我正在处理网络数据,并且在R中的igraph包中遇到了一个奇怪的(或者至少我没有料到的) count.multiple行为。
library(igraph)
library(plyr)
df <- data.frame( sender = c( "a", "a", "a", "b", "b", "c","c","d" ),
receiver = c( "b", "b", "b", "c", "a", "d", "d", "a" ) )我想要的是计算所有的边,并使用倍数作为权重。
当我执行ddply(df, .(sender, receiver), "nrow")时,我的结果是:
sender receiver nrow
1 a b 3
2 b a 1
3 b c 1
4 c d 2
5 d a 1这正是我所期望的。
但是,我不能使用igraph的count.multiple重现它,这是我期望在igraph中实现的
df.graph <- graph.edgelist(as.matrix(df))
E(df.graph)$weight <- count.multiple(df.graph)E(df.graph)$weight产生:
3 3 3 1 1 2 2 1然后我使用了simplify命令:
df.graph <- simplify(df.graph)它会产生
9 1 1 4 1我知道这里是怎么回事,simplify只是增加了权重,但我不明白为什么/什么时候会使用它,而不是ddply正在做的事情。
有什么想法吗?
谢谢!
发布于 2012-06-20 07:21:51
simplify的默认行为是添加多个边的权重。
为了避免重复计算,可以将初始权重设置为1
g <- graph.edgelist(as.matrix(df))
E(g)$weight <- 1
g <- simplify( g )
E(g)$weight或者更改它们的聚合方式。
g <- graph.edgelist(as.matrix(df))
E(g)$weight <- count.multiple(g)
g <- simplify( g, edge.attr.comb = list(weight=max, name="concat", "ignore") )
E(g)$weighthttps://stackoverflow.com/questions/11108416
复制相似问题