在我的数据集中,由不同范围表示的变量,例如Female_Age_Band,给出了15-20,20-25,25-30,...&,on.But,所以问题是在数据不可用的地方,特定的观察值被标记为“不可用”,这使得sas将这个字段作为一个字符读取。因此,我认为这将使在逻辑回归中调用该变量变得困难。此外,还有一些特定的分类字段具有3个不同的指示符0 1 & 2。但即使是这些字段也有"Unavailable“标签。从技术上讲,我不能将它们替换为零,因为零可能是一个有效值。
有没有人能帮我解决这个问题?
发布于 2017-01-12 00:25:21
这个问题比“不可用”更严重,因为"15-20“也会被读取为字符。但您不希望将它们全部替换为中间值,因为这会使事情变得非常奇怪。你没有XXX 17.5岁的人。
我要做的是使用一个数据步骤将数据重新编码为均匀分布在每个年龄段内,并将“不可用”重新编码为。
(对不起,我刚买了一台新计算机,正在等待新的SAS安装,所以我现在不能显示代码)。
https://stackoverflow.com/questions/41553181
复制相似问题