首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >MATLAB是否支持有监督机器学习算法的并行化?替代方案?

MATLAB是否支持有监督机器学习算法的并行化?替代方案?
EN

Stack Overflow用户
提问于 2015-06-12 20:54:18
回答 1查看 331关注 0票数 0

到目前为止,我已经使用RapidMiner完成了一些数据/文本挖掘任务,但随着数据量的增加,存在着巨大的性能问题。AFAIK RapidMiner并行处理扩展只适用于企业版--不幸的是,我仅限于社区版。

现在我想使用MATLAB (学术许可证)将任务转移到一个高性能集群上。我没有找到并行计算工具箱支持的任何信息,例如SVM或KNN。

MATLAB或其他库是否支持数据挖掘算法的并行化?

EN

回答 1

Stack Overflow用户

发布于 2015-06-12 21:30:24

MATLAB的大多数数据挖掘和机器学习功能都包含在统计工具箱(在最近的版本中,称为统计和机器学习工具箱)中。要启用并行化,您还需要并行计算工具箱,要在HPC集群上执行该并行化,您需要在集群上安装MATLAB分布式计算服务器。

您可能想要并行处理数据挖掘任务的方法有很多,例如,您可能想要并行处理单个学习任务,或者并行交叉验证,或者在多个数据集中并行处理多个学习任务。

第一种方法对于统计工具箱中的一些数据挖掘算法是可能的,但不是所有的。MathWorks正在逐步引入这一点。例如,支持向量机是并行化的,有一种用于袋装决策树的并行化算法,但我相信kmeans学习目前还没有并行化。您需要查看统计工具箱的文档,以找出所需的算法是否在列表中。

第二个是可能的。统计工具箱中用于交叉验证(以及自举、插孔)的功能是并行化的,一些特征选择算法也是如此。为了在多个数据集上并行运行多个作业,您可以使用并行计算工具箱中的功能(例如parfor或并行for循环)来迭代它们。

此外,即将发布的MATLAB的R2015b版本(将于9月发布)将包括支持图形处理器的统计功能,从而提供额外的加速。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30803627

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档