文章/答案/技术大牛

发布

社区首页 >问答首页 >ML管道和指标:精确度、召回率、AUC-ROC、F1Score

问ML管道和指标:精确度、召回率、AUC-ROC、F1Score
EN

Stack Overflow用户

提问于 2016-11-17 21:11:22

回答 2查看 5.2K关注 0票数 3

我正在使用ML Pipeline，类似于：

VectorAssembler assembler = new VectorAssembler()
                .setInputCols(columns)
                .setOutputCol("features");
LogisticRegression lr = new LogisticRegression().setLabelCol(targetColumn);
        lr.setMaxIter(10).setRegParam(0.01).setFeaturesCol("features");

Pipeline logisticRegression = new Pipeline();
logisticRegression.setStages(new PipelineStage[] {assembler, lr});
PipelineModel logisticRegressionModel = logisticRegression.fit(learningData);

我想要的是在这个模型上获得像Precision, Recall, AUC-ROC, F1-SCORE, ACCURACY这样的标准度量的方法。我已经找到了BinaryClassificationMetrics --但我不确定它是否兼容。RegressionEvaluator似乎只返回mse|rmse|r2|mae。

那么用ML Pipeline提取精确度、召回等的正确方法是什么呢？

apache-spark

apache-spark-mllib

apache-spark-ml

precision-recall

回答 2

Stack Overflow用户

发布于 2017-12-19 21:13:22

Ryan在上面的回答中遗漏了几件事。

我可以确认以下工作(注意:我的用例是多类分类)

val scoredTestSet = model.transform(testSet)
val predictionLabelsRDD = scoredTestSet.select("prediction", "label").rdd.map(r => (r.getDouble(0), r.getDouble(1)))
val multiModelMetrics = new MulticlassMetrics(predictionAndLabelsRDD)

票数 3

Stack Overflow用户

发布于 2016-11-23 11:29:05

获得评分数据后，获取预测和标签并将其传递给BinaryClassificationMetrics

如下所示(虽然它是在scala中的，但我希望它能有所帮助)

val scoredTestSet = logisticRegressionModel.transform(testSet)
val predictionLabelsRDD = scoredTestSet.select("prediction", "label").map(r => (r.getDouble(0), r.getDouble(1)))
val binMetrics = new BinaryClassificationMetrics(predictionAndLabels)
// binMetrics.areaUnderROC

来自https://spark.apache.org/docs/latest/mllib-evaluation-metrics.html#binary-classification的其他示例

在这种情况下，预测值为1.0或0.0。您还可以提取概率，并使用该概率代替预测值，这样binMetrics就可以显示多个阈值的数据

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/40655835

复制

相似问题

问ML管道和指标:精确度、召回率、AUC-ROC、F1Score
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问ML管道和指标:精确度、召回率、AUC-ROC、F1ScoreEN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问ML管道和指标:精确度、召回率、AUC-ROC、F1Score
EN