文章/答案/技术大牛

发布

社区首页 >问答首页 >org.apache.spark.ml.classification与org.apache.spark.mllib.classification的区别

问org.apache.spark.ml.classification与org.apache.spark.mllib.classification的区别
EN

Stack Overflow用户

提问于 2015-05-14 07:35:24

回答 2查看 6.2K关注 0票数 17

我正在编写一个星星之火应用程序，并希望在MLlib中使用算法。在API文档中，我为相同的算法找到了两个不同的类。

例如，LogisticRegression在org.apache.spark.ml.classification中有一个，在org.apache.spark.mllib.classification中也有一个LogisticRegressionwithSGD。

我唯一能找到的区别是，org.apache.spark.ml中的那个是从Estimator继承的，可以用于交叉验证。我很困惑，因为它们被放在不同的包裹里。有人知道原因吗？谢谢!

apache-spark-mllib

scala

apache-spark

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-05-14 07:44:35

是JIRA机票

来自设计博士

MLlib现在涵盖了机器学习算法的基本选择，例如逻辑回归、决策树、交替最小二乘和k-均值。当前的一组API包含几个设计缺陷，这些缺陷阻碍了我们解决实际的机器学习管道，使MLlib本身成为一个可伸缩的项目。新的API集将在org.apache.spark.ml下运行，一旦我们将所有特性迁移到o.a.s.ml，就不再推荐o.a.s.mllib了。

票数 23

Stack Overflow用户

发布于 2016-03-30 09:34:20

星火导轨说：

spark.mllib包含构建在RDD之上的原始API。 spark.ml为构建ML管道提供了建立在DataFrames之上的高级API .

和

推荐使用spark.ml，因为使用DataFrames时，API更通用、更灵活。但随着spark.mllib的发展，我们将继续支持spark.ml。用户应该乐于使用spark.mllib特性，并期待更多功能的出现。开发人员应该为spark.ml提供新的算法，如果它们很好地符合ML流水线概念，例如，特征提取器和变压器。

我想医生解释得很好。

票数 6

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/30231840

复制

相似问题

问org.apache.spark.ml.classification与org.apache.spark.mllib.classification的区别
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问org.apache.spark.ml.classification与org.apache.spark.mllib.classification的区别EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问org.apache.spark.ml.classification与org.apache.spark.mllib.classification的区别
EN