首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >倒ROC曲线

倒ROC曲线
EN

Data Science用户
提问于 2022-09-21 18:54:34
回答 2查看 491关注 0票数 1

我在R.中使用tidymodel软件包对三个类进行分类。共有约8000个样本和130个特征。这就是中华民国曲线的样子。

对所有三个类的预测实际上都很好,与预期相吻合。这些错误分类的样本也很容易解释。下面是测试数据软件给出的一些度量标准:

代码语言:javascript
复制
  .metric      .estimate
1 accuracy         0.887
2 bal_accuracy     0.917
3 f_meas           0.887
4 kap              0.831
5 mcc              0.835
6 precision        0.895
7 recall           0.889
8 roc_auc          0.975

以及混乱矩阵。

代码语言:javascript
复制
           Truth
Prediction A     B      C
A          573   19     22
B          6     662    17
C          148   25     628

一切似乎都很好,除了奇怪的中华民国曲线。我想找个解释。

EN

回答 2

Data Science用户

发布于 2022-09-21 19:48:01

如果预测或黄金标签(但不是两者都)被逆转,这种情况就会发生。例如,被预测为正的实例被我们的函数解释为否定的,反之亦然。这从对角线给出了真实曲线的精确镜像,使它看起来好像分类器做的比随机的差。您肯定在某个地方有一个bug,可能是一些逆转类的隐式类型转换吗?(R有时会做一些不直观的事情!)

另外,第三条曲线看起来很好,这可能对你有帮助:前两条曲线和这条曲线之间的代码一定有区别。

票数 2
EN

Data Science用户

发布于 2023-02-13 02:28:54

ROC曲线的倒置可能是由yardstick's假设事件由第一个因素级别指示的。设置以下选项提供了一个解决方案:

代码语言:javascript
复制
options(yardstick.event_first = FALSE)

rf_training_pred %>%
roc_curve(truth=Species,.pred_setosa,.pred_versicolor,.pred_virginica) %>%
autoplot(rf_training_roc)

或者,可以将event_level函数中的roc_curve参数设置为“第二次”。

请参阅:https://github.com/tidymodels/yardstick/issues/94

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/114594

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档