我刚刚开始掌握复杂网络和社交网络分析背后的想法和技术。我似乎总是在数据准备阶段出错并陷入困境。我经常在Google Refine中有一个数据集,它基本上是一堆以某种方式相关的行。例如,目前我有一个他们参加过的组织和活动的列表(有些重复,因为一个组织可能派了多个代表参加一个活动)。

因此,我可以看到,组织将是我的图表上的节点,如果他们都参加了相同的活动,则它们之间的关系是存在的,但是我不知道如何将此数据集转换为NWB、Gephi、R或Tulip等工具可以理解的格式。
我经常发现自己处于这样一种情况:我有一个数据集,我可以看到列之间的关系,但我不知道下一步应该采取什么步骤来准备我的数据,以便通过这些工具导入以探索这种关系。我已经查阅了有关支持的文件类型的文档,我猜测,使用Refine中的RDF框架工具并采用链接数据样式方法可能是一种可能的解决方案,但我没有运气。
任何有关数据准备的技巧都将不胜感激。
发布于 2012-06-12 05:16:27
只是以防万一有人在未来偶然发现了这一点..我通过在R中导入我的CSV并创建一个模式矩阵,然后在此基础上创建一个图形来实现这一点。
organisations_events<-read.csv("/Users/David/Desktop/PhD/R_github/ROI/data/Ins_Event.csv" , header=T, sep=",")
df<-read.csv("/Users/David/Desktop/PhD/R_github/ROI/data/Ins_Event.csv" , header=T, sep=",")
M = as.matrix( table(df) )
Mrow = M %*% t(M)
#Mcol = t(M) %*% M
write.csv(Mrow, "test.csv")如果有帮助,我在这里写了答案..http://www.davidsherlock.info/network-analysis
https://stackoverflow.com/questions/10800408
复制相似问题