寻找随机森林分类器指标,如ROC,精确度回忆曲线,精确度,召回率,基于数据帧使用pyspark的F1分数。我可以在RDD object.Could上得到相同的指标,请帮帮忙。
发布于 2019-04-10 21:03:30
例如:
from pyspark.mllib.evaluation import BinaryClassificationMetrics
predictions = model.transform(some_data_in_dataframe)
labels_and_predictions = predictions.select("prediction","true_label").rdd
metrics = BinaryClassificationMetrics(labels_and_predictions)
print((metrics.areaUnderPR * 100))
print((metrics.areaUnderROC * 100))https://stackoverflow.com/questions/55604228
复制相似问题