首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于社会网络FOAF数据集的关联规则挖掘

基于社会网络FOAF数据集的关联规则挖掘
EN

Stack Overflow用户
提问于 2011-04-18 17:01:20
回答 3查看 1.6K关注 0票数 4

我正在做一个名为“从社交网络数据中发现关联规则:将数据挖掘引入语义网”的项目。有没有人能推荐一个好的算法源码(以及它的代码。我听说它可以使用Perl和R包实现)来从社交网络数据库中查找关联规则?

可以在以下链接中获取数据库的快照:https://docs.google.com/uc?id=0B0mXGRdRowo1MDZlY2Q0NDYtYjlhMi00MmNjLWFiMWEtOGQ0MjA3NjUyZTE5&export=download&hl=en_US

该数据集可通过以下链接获得:http://ebiquity.umbc.edu/get/a/resource/82.zip

我已经搜索了很多关于这个项目,但不幸的是还没有找到有用的东西。下面的链接我发现有些相关:

犯罪数据:http://www.computer.org/portal/web/csdl/doi/10.1109/CSE.2009.435

我们将非常感谢您的帮助。

谢谢,

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2011-05-31 14:11:50

这比http://en.wikipedia.org/wiki/Association_rule_learning有点宽,但希望有用。

一些可能有趣的早期FOAF工作(SVD/PCA等):

http://stderr.org/~elw/foaf/ http://www.scribd.com/doc/353326/The-Social-Semantics-of-LiveJournal-FOAF-Structure-and-Change-from-2004-to-2005 http://datamining.sztaki.hu/files/snakdd.pdf

此外,http://www.amazon.com/Understanding-Complex-Datasets-Decompositions-Knowledge/dp/1584888326的第4章致力于针对图形数据结构的矩阵分解技术的应用;强烈推荐。

最后,Apache Mahout是大规模数据挖掘、机器学习等的自然选择,https://cwiki.apache.org/MAHOUT/dimensional-reduction.html

票数 2
EN

Stack Overflow用户

发布于 2011-04-18 18:58:48

最初的关联规则算法(最初是在IBM Almaden研究中心开发的)最广泛使用的实现是Apriori,特别是Christian Borgelt的C实现。

(对于那些不熟悉关联规则(也称为“频繁项目集”或“市场篮子分析”)的人来说,这是一个简短的总结。关联规则的原型应用程序正在分析消费者交易,例如,超市数据:在购买波兰香肠的购物者中,也购买黑面包的购物者占多大比例?)

我推荐这个统计平台,R.它是免费和开源的,它的软件包存储库包含(至少)四个专门针对关联规则的库,所有这些库都有出色的文档--四个软件包中的三个包括手册和单独的Vignette (带有代码示例的非正式散文文档)。无论是手册还是小插曲都包含了大量的R代码示例。

我已经使用了下面四个包中的三个,我可以强烈推荐这三个包。其中包括Eclat和Apriori的绑定。这些库以R 'Packages‘的形式分发,可在R的主包存储库CRAN上获得。R的基本安装和设置很简单--上面的链接提供了适用于Mac、Linux和Windows的二进制文件。同样,软件包安装/集成就像您在集成平台上所期望的那样简单(尽管下面列出的四个软件包中并不是每个操作系统都有二进制文件)。

因此,在CRAN上,你会发现这些包都是完全定向的关联规则:

  • arulesNBMiner
  • arulesSequences

这组四个R包包括四个不同关联规则实现的R绑定,以及一个可视化库。

第一个包arules包含用于Eclat和Apriori的R绑定。第二个,arulesNBMiner,是Michael Hahsler的关联规则算法NB-frequent itemsets by的绑定。第三个是arules序列,是Mohammed Zaki的cSPADE的绑定。

其中最后一个特别有用,因为它是一个可视化库,用于绘制前三个包的输出。对于您的社交网络研究,我怀疑您会发现图形可视化--即节点(数据集中的用户)和边(它们之间的连接)的显式可视化。

票数 4
EN

Stack Overflow用户

发布于 2012-04-16 03:15:50

如果你想要一些Java代码,你可以在我的website上找到SPMF软件。它提供了超过45种算法的源代码,用于频繁项集挖掘、关联挖掘、序列模式挖掘等。

此外,它不仅提供了最流行的算法。它还提供了许多变体,如挖掘稀有项集、高效用项集、不确定项集、非冗余关联规则、闭合关联规则、间接关联规则、top-k关联规则等。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5700621

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档