我使用以下代码使用艾米莉亚进行了多次估算
binary<- c("Gender", "Diabetes")
exclude.from.IMPUTATION<-c( "Serial.ID")
NPvars<- c("age", "HDEF","BMI")#a skewed (non-parametric variable
a.out <- Amelia::amelia(x = for.imp.data,m=10,
idvars=exclude.from.IMPUTATION,
noms = binary, logs =NPvars)
summary(a.out)
## save imputed datasets ##
Amelia::write.amelia(obj=a.out, file.stem = "impdata", format = "csv")我有10个不同的输出数据csv文件(如下图所示)

我知道我可以使用它们中的任何一个来进行描述性分析,如以前的问题所示,但是

发布于 2020-12-29 17:44:04
您不能只使用这些数据集中的一个。正如你正确地指出的,那么整个多重归责的过程将是无用的。
正如jay.sf所说,不同的数据集表达了归责的不确定性。丢失的数据最终会丢失--我们只能估计真实的数据会是什么样子。通过多次计算,我们产生了多个估计,真实的数据会是什么样子。总的来说,这可以用来说这样的话:丢失的数据很可能介于.还有..。
当您生成描述性统计信息时,您将分别为每个推测的数据集生成这些统计信息。例如,从平均值的角度来看,您可以提供作为附加信息的数据集上的最低平均值和最高平均值。您可以提供这些平均值的平均值和计算出的数据集的平均值的标准差。这样,你的读者就会知道,这种归罪带来了多少不确定性。
您还可以使用您的估算数据集来描述线性模型输出的不确定性。您可以使用Rubin的规则(RR)来汇集参数估计,如均值差异、回归系数、标准误差,并导出置信区间和p值。(另见https://bookdown.org/mwheymans/bookmi/rubins-rules.html)
https://stackoverflow.com/questions/57711161
复制相似问题