我正在尝试预测燃气管道泄漏所需的时间。我使用了15个特性,其中最重要的一个是“管道安装年”。我拥有的最新泄漏数据是2017年发生的泄漏,该管道是在2009年安装的。我知道,我建立的普通ML模型无法很好地预测2009年后安装的管道的泄漏持续时间。我这么说的原因是因为我首先根据他们的“安装年”对数据进行了排序,然后做了一个训练测试拆分,看看它如何在预测测试数据集中发挥作用,我得到了%93R平方,但当我在火车测试拆分中关闭了混洗功能时(这意味着与正常的火车测试拆分不同,子集是随机选择的,数据将按第一个%80训练和最后%20个测试的顺序排列),看看它是否可以预测他们的“安装年份”不在模型训练中的管道,我只得到了%30个R平方。我知道“安装年份”是一个非常重要的特征,ML模型无法预测管道的“安装年份”没有在模型中进行训练。
我也在正常的ML模型上使用生存回归,我不确定在COX PH模型和其他多变量生存模型中是否也会有同样的问题。COX PH是否能够预测2009年后安装的管道的危险比和生存函数?
发布于 2019-03-29 21:16:23
coxph能够预测2009年后安装的管道的危险比和生存函数吗?coxph应该能够计算给定时期的危险比和生存函数(这是它应该做的)。您可以运行它并绘制一个KM,看看它是否有意义,您可以利用结果。
https://stackoverflow.com/questions/54393644
复制相似问题