已知ZeroR模型用于预测给定数据集中的多数类。
话虽如此,如果有一个平衡的数据集(50/50),ZeroR是否是一个合适的性能基线?
如果不是,用于二进制分类(正/负)的朴素贝叶斯分类模型的好基线是什么?
发布于 2021-05-29 22:06:39
当然,ZeroR是一个非常好的基线。在这种情况下,我认为最好称它为随机基线,而不是多数基线,因为它就是这样的。
据我所知,这是用于任何分类任务的唯一基本基线。其他基线将涉及基于具体任务的更复杂的内容。拥有更有竞争力的基线的标准方法是使用最先进的方法来完成这项任务。
另外,基线或评估方法不依赖于学习算法,无论是NB还是其他任何分类方法。
https://datascience.stackexchange.com/questions/95039
复制相似问题