文章/答案/技术大牛

发布

社区首页 >问答首页 >惩罚正误的度量

问惩罚正误的度量
EN

Data Science用户

提问于 2020-12-09 21:01:48

回答 3查看 276关注 0票数 2

我参与了一个船舶中转时间预测项目。指的是预测一艘船的货物从A港到B港需要多长时间，以便与最快的承运人公司签约，并告诉客户需要多长时间，因为一家承运人公司需要多少时间(多数情况下更多)。

我们有带有预测变量的历史数据库，重点是如果货物的实际转运时间为10天，则比模型估计的9天差，甚至绝对误差为1。

因此，需要一个自定义的度量来惩罚正误多于负错误，并惩罚绝对大的错误，调用错误=实际预测。

我想使用加权均方误差，但我不知道如何平衡权重。你们能帮我吗？您知道满足这种要求的其他指标吗？

非常感谢！

predictive-modeling

metric

回答 3

Data Science用户

发布于 2020-12-11 12:23:50

用指数函数和线性函数或多项式函数的差如何？

例如，如果是x = actual - predicted，那么

L = w_1 (e^x-1) - w_2 x

对于正值而言，误差增加的速度要快于负值，这是x的一个可微函数。您可以根据您的典型错误和学习算法调整w_1和w_2。对于w_1 = w_2 = 20来说，这就是一个例子：

票数 2

Data Science用户

发布于 2020-12-12 09:57:09

另一个简单的方法是使用Pinball损失函数，您可以使用这个函数来预测分位数。设τ表示目标分位数，y表示目标，z表示分位数，则弹球损失定义为：L_τ= \begin{cases} (y-z)τ,\text{if}\ y\geq z \\ (z-y)(1-τ), \text{if}\ y<z\\ \end{cases}。

这是分位数回归的标准损失，对于τ=0.50，这相当于标准的\ell_1损失，即预测条件中值。

唯一剩下的就是如何找到最优的目标分位数。这取决于手头的业务应用程序。假设低于预测c_{down}的成本和过度预测c_{over}的成本，最优分位数定义为：τ^*=\frac{c_{down}}{c_{down}+c_{over}}

票数 1

Data Science用户

发布于 2021-01-05 08:00:58

如果您对不可微的成本函数(或更准确地说是非光滑的)很好，那么有一个简单直观的度量，涉及定义如下的阶跃函数\theta(x)#qcStackCode#：

\theta(x)={\begin{cases}1&{\text{if }}x \ge 0\\0&{\text{if }}x < 0\\\end{cases}}

就step职能确定的费用如下：

L(\Delta t) = w \times \theta(\Delta t) \times \Delta t

它只惩罚正时差\Delta t，而将零成本分配给负时差(w是一个可以分配给任何值的自由参数权重，例如1)。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/86475

复制

相似问题

问惩罚正误的度量
EN

回答 3

Data Science用户

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问惩罚正误的度量EN

回答 3

Data Science用户

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问惩罚正误的度量
EN