你好,我已经准备好了一个多类分类模型,并在数据集上进行了训练
Label Feat1 Feat2 Feat3 Feat4
Class1 10 21 12 2
Class2 3 6 7 9
Class3 14 8 8 10
Class4 1 5 5 9我目前可以使用Sckit中的预测功能-学习应用最好的模型来预测单个类别。这样我就可以得到列Predicted_Label了。如何处理问题以获得预测列表,即第二或第三最佳预测
Test_Data_Set
Feat1 Feat2 Feat3 Feat4 Predicted_Label Predicted_Label_2nd_Best_Prediction
1 3 10 7 Class1 [Class1,Class4]发布于 2019-11-25 21:03:12
请参考此问题:Understanding predict_proba from MultiOutputClassifier
您需要在model上使用predict_proba()来获取训练数据集的每一行的每个类的概率。在你的例子中,如果你有4个类,你会得到一个长度为4的数组。
然后,您可以获得第二大概率的第二个最佳预测类别。
Multiclass MultiOutput Classification example on sklearn documentation
注:predict_proba()中每个长度为4的数组的总和为1。
https://stackoverflow.com/questions/59032277
复制相似问题