假设我试图预测一个变量y,它是从0到10的分数(仅为整数),我使用的是线性回归模型。这个模型实际上是在这个区间内生成实数。
我使用的是回归,而不是分类,因为我想说(比如说)2缺少正确的预测比忽略1更糟糕,目前我使用的是平均绝对误差作为评估指标。
假设来自模型的预测是实数,那么在允许的整数集合(从0到10)中约束它的最佳方法是什么?我是应该把预测数舍入最近的整数,还是用任何更好的方法?
发布于 2018-04-14 19:47:33
您还可以使用多项logistic回归模型,并且可以使用分类精度来衡量该模型的性能。
发布于 2018-04-14 19:40:39
范围从0到11,并舍入到最近的.5数。这给了你10个均匀间隔,大小相等的类别。如果可以的话,请权衡回归到.5标记有多近,因为理想情况下,结果不应该足够接近边界,从而导致歧义。
或者,范围从-0.5到10.5,并使用整数作为目标。它没有什么区别,但与您现有的网络兼容。
https://stackoverflow.com/questions/49835432
复制相似问题