首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >org.apache.spark.ml.classification与org.apache.spark.mllib.classification的区别

org.apache.spark.ml.classification与org.apache.spark.mllib.classification的区别
EN

Stack Overflow用户
提问于 2015-05-14 07:35:24
回答 2查看 6.2K关注 0票数 17

我正在编写一个星星之火应用程序,并希望在MLlib中使用算法。在API文档中,我为相同的算法找到了两个不同的类。

例如,LogisticRegression在org.apache.spark.ml.classification中有一个,在org.apache.spark.mllib.classification中也有一个LogisticRegressionwithSGD。

我唯一能找到的区别是,org.apache.spark.ml中的那个是从Estimator继承的,可以用于交叉验证。我很困惑,因为它们被放在不同的包裹里。有人知道原因吗?谢谢!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-05-14 07:44:35

JIRA机票

来自设计博士

MLlib现在涵盖了机器学习算法的基本选择,例如逻辑回归、决策树、交替最小二乘和k-均值。当前的一组API包含几个设计缺陷,这些缺陷阻碍了我们解决实际的机器学习管道,使MLlib本身成为一个可伸缩的项目。 新的API集将在org.apache.spark.ml下运行,一旦我们将所有特性迁移到o.a.s.ml,就不再推荐o.a.s.mllib了。

票数 23
EN

Stack Overflow用户

发布于 2016-03-30 09:34:20

星火导轨说:

spark.mllib包含构建在RDD之上的原始API。 spark.ml为构建ML管道提供了建立在DataFrames之上的高级API .

推荐使用spark.ml,因为使用DataFrames时,API更通用、更灵活。但随着spark.mllib的发展,我们将继续支持spark.ml。用户应该乐于使用spark.mllib特性,并期待更多功能的出现。开发人员应该为spark.ml提供新的算法,如果它们很好地符合ML流水线概念,例如,特征提取器和变压器。

我想医生解释得很好。

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30231840

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档