我正在使用xgboost创建一个模型。关于参数,它的objective是survival:cox,eval_metric是cox-nloglik。输出Y在-800到800之间。然而,预测的值是大的(范围从10^3到10^13)。为什么会这样呢?xgboost中Cox回归的结果是什么?
发布于 2019-05-17 03:47:21
在文件中,您可以发现这些预测是在危险比率尺度上返回的:
生存:考克斯回归的权利审查生存时间数据(负值被认为是权利审查)。请注意,预测是在危险比标度上返回的(即比例风险函数h(t) = h0(t) * HR中的HR=exp(H0))。
换句话说,在Cox比例风险率模型中,我们有:
其中X在传统线性模型中的形式是exp(b_1x_1+b_2x_2+...+b_px_p),以及h_0(t) = 基线风险率函数。在具有树基学习器的xgboost情况下,X是根据为生存数据而设计的损失函数的负梯度上训练的单个树的加权和产生的指数预测。
换句话说,预测值不是失败的时候。
我发现关于生存的xgboost文档:cox设置非常稀疏,而且描述得不太好。据我所知,我不认为有一个内部方法来派生h_0(t)例如。
https://datascience.stackexchange.com/questions/52097
复制相似问题