面对这个数据集:https://archive.ics.uci.edu/ml/datasets/wine+quality将其视为分类任务和回归任务。
因为把酒的质量分类为8,而把酒的质量分为3,这是一个巨大的差别,而将5分为6,并不是那么糟糕。
这有两个子问题:
非常感谢
发布于 2017-12-03 15:02:09
这是序号分类。用输出概率的任何分类器来处理这一问题的快速方法将被彻底解释为这里。
一句话:例如,如果您有三个序数类Cool < Mild < Hot,那么您将创建二进制分类器。
对于第一个和最后一个类,您计算的概率如下所示:
。
这是P(temp > cool),where,P(temp = cool) = 1 - P(temp > cool)给出的
。
您计算(既不温和也不凉爽)为:P(temp > mild),因此P(temp = hot) = P(temp > mild)
所有中间分类(在这里,我们只有一个)的结果是减法。我们有所有比cool (这里是mild和hot)更大的情况,但是我们也排除了比mild更大的概率。
这就给我们留下了成为mild的可能性:
https://datascience.stackexchange.com/questions/25298
复制相似问题