我有一个具有可变证据权重的数据集,其中包括Inf/-inf。我用的是线性回归,但是它不能被训练,造成了误差。
lm.fit中的错误(x,y,偏移量=偏移量,singular.ok = singular.ok,.):'y‘中的NA/NaN/Inf
我正在寻找一个模型,它可以使用Inf进行训练,并预测测试数据的灾难值。如果这是不可能的,是否有另一个解决方案的Inf,如清洁或突变?
发布于 2020-01-25 12:00:25
您必须了解这些Inf案例的性质。
在大多数情况下,您可以将它们视为异常值。有很多技术可以解决这个问题。您可以用均值/中值替换它们,可以用简单的线性回归模型预测值,或者,如果Inf实例在总观测值中的百分比相对较低,则可以将它们排除在外。
希望这能带来一些清晰。
https://stackoverflow.com/questions/59908906
复制相似问题