我喜欢Weka的视觉数据探测功能(它能快速给您提供一英里高的空中视图来查看所有变量的分布)。
我有一个0.5gb的数据集,而Weka无法加载它(在64位Windows PC上有16 on的RAM)。
对于Weka的粉丝们来说,对于非常大的数据集,最接近的“视觉数据探索”选择是什么?
(FWIW -当Weka在加载一个非常大的数据集时失败时,我做了所有建议的事情,例如增加Java堆大小等。)
更新:我尝试了RapidMiner Basic (它是开放源码的,免费的),这起作用了。
发布于 2016-04-15 20:38:51
我尝试了Azure机器学习(由微软),它是非常好的。它可以轻松地处理大型数据集,并具有类似于用于ML任务和可视化的weka管道。他们免费提供30天,这样你就可以试试看。您可以搜索它或遵循以下链接Azure ML
发布于 2016-04-15 21:45:25
首先,我想提出橙色数据挖掘套件。

但是,我几乎可以肯定地知道,没有可用的64位NumPy的Windows版本,而Orange使用该版本,因此您的数据可能无法与他们提供的32位Windows版本相适应。如果您能够很好地找到解决Python问题的方法,它可能是可安装的,但它也可能更容易切换到更高效的平台(即支持GNU/Linux和Macintosh )。
https://datascience.stackexchange.com/questions/11201
复制相似问题