首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >惩罚正误的度量

惩罚正误的度量
EN

Data Science用户
提问于 2020-12-09 21:01:48
回答 3查看 276关注 0票数 2

我参与了一个船舶中转时间预测项目。指的是预测一艘船的货物从A港到B港需要多长时间,以便与最快的承运人公司签约,并告诉客户需要多长时间,因为一家承运人公司需要多少时间(多数情况下更多)。

我们有带有预测变量的历史数据库,重点是如果货物的实际转运时间为10天,则比模型估计的9天差,甚至绝对误差为1。

因此,需要一个自定义的度量来惩罚正误多于负错误,并惩罚绝对大的错误,调用错误=实际预测。

我想使用加权均方误差,但我不知道如何平衡权重。你们能帮我吗?您知道满足这种要求的其他指标吗?

非常感谢!

EN

回答 3

Data Science用户

发布于 2020-12-11 12:23:50

用指数函数和线性函数或多项式函数的差如何?

例如,如果是x = actual - predicted,那么

L = w_1 (e^x-1) - w_2 x

对于正值而言,误差增加的速度要快于负值,这是x的一个可微函数。您可以根据您的典型错误和学习算法调整w_1w_2。对于w_1 = w_2 = 20来说,这就是一个例子:

票数 2
EN

Data Science用户

发布于 2020-12-12 09:57:09

另一个简单的方法是使用Pinball损失函数,您可以使用这个函数来预测分位数。设τ表示目标分位数,y表示目标,z表示分位数,则弹球损失定义为:L_τ= \begin{cases} (y-z)τ,\text{if}\ y\geq z \\ (z-y)(1-τ), \text{if}\ y<z\\ \end{cases}

这是分位数回归的标准损失,对于τ=0.50,这相当于标准的\ell_1损失,即预测条件中值。

唯一剩下的就是如何找到最优的目标分位数。这取决于手头的业务应用程序。假设低于预测c_{down}的成本和过度预测c_{over}的成本,最优分位数定义为:τ^*=\frac{c_{down}}{c_{down}+c_{over}}

票数 1
EN

Data Science用户

发布于 2021-01-05 08:00:58

如果您对不可微的成本函数(或更准确地说是非光滑的)很好,那么有一个简单直观的度量,涉及定义如下的阶跃函数\theta(x)#qcStackCode#

\theta(x)={\begin{cases}1&{\text{if }}x \ge 0\\0&{\text{if }}x < 0\\\end{cases}}

就step职能确定的费用如下:

L(\Delta t) = w \times \theta(\Delta t) \times \Delta t

它只惩罚正时差\Delta t,而将零成本分配给负时差(w是一个可以分配给任何值的自由参数权重,例如1)。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/86475

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档