首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Weka替代-使用非常大的数据集进行可视化数据探索

Weka替代-使用非常大的数据集进行可视化数据探索
EN

Data Science用户
提问于 2016-04-13 19:18:29
回答 2查看 524关注 0票数 1

我喜欢Weka的视觉数据探测功能(它能快速给您提供一英里高的空中视图来查看所有变量的分布)。

我有一个0.5gb的数据集,而Weka无法加载它(在64位Windows PC上有16 on的RAM)。

对于Weka的粉丝们来说,对于非常大的数据集,最接近的“视觉数据探索”选择是什么?

(FWIW -当Weka在加载一个非常大的数据集时失败时,我做了所有建议的事情,例如增加Java堆大小等。)

更新:我尝试了RapidMiner Basic (它是开放源码的,免费的),这起作用了。

EN

回答 2

Data Science用户

发布于 2016-04-15 20:38:51

我尝试了Azure机器学习(由微软),它是非常好的。它可以轻松地处理大型数据集,并具有类似于用于ML任务和可视化的weka管道。他们免费提供30天,这样你就可以试试看。您可以搜索它或遵循以下链接Azure ML

票数 1
EN

Data Science用户

发布于 2016-04-15 21:45:25

首先,我想提出橙色数据挖掘套件

但是,我几乎可以肯定地知道,没有可用的64位NumPy的Windows版本,而Orange使用该版本,因此您的数据可能无法与他们提供的32位Windows版本相适应。如果您能够很好地找到解决Python问题的方法,它可能是可安装的,但它也可能更容易切换到更高效的平台(即支持GNU/Linux和Macintosh )。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/11201

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档