首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >数据挖掘开源工具

数据挖掘开源工具
EN

Stack Overflow用户
提问于 2009-05-07 16:37:50
回答 20查看 18.9K关注 0票数 27

我将从事一个数据挖掘的项目。在我开始之前,我想探索一下不同的数据挖掘工具(最好是开源的),它们允许基于web的报告。在我的场景中,数据将被提供给我,所以我不应该爬取它。

简而言之,我正在寻找一个工具,它做-数据分析,基于网络的报告,提供了某种仪表板和挖掘功能。

我曾经在Microsoft Analysis Services和BOXI上工作过,后来我一直在研究Pentaho,这似乎是一个很好的选择。

请在你所知道的任何这样的工具上分享你的经验。

干杯

EN

回答 20

Stack Overflow用户

发布于 2009-05-07 16:55:58

我相信WEKA是最好的开源DM软件。

检查它:http://www.cs.waikato.ac.nz/ml/weka/

票数 12
EN

Stack Overflow用户

发布于 2009-09-10 04:15:18

Weka很棒,但是您可能想尝试一下Orange Data Mining工具包。

http://www.ailab.si/orange/

编辑:,从2010年11月开始,我必须说我真的很喜欢KNIME

票数 9
EN

Stack Overflow用户

发布于 2009-09-18 20:32:38

R有很多与数据挖掘相关的优秀包。特别要注意的是:

  • The machine learning view on CRAN.
  • The natural language processing view on CRAN.

它还与Weka (see the RWeka package)捆绑在一起。它可以与.Net (通过COM)或Python (通过RPy或RPy2)集成。

我同意将Pentaho作为一个报告平台,尽管这是一个非常大的项目,这取决于你使用它的目的。

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/835754

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档