首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用阿米莉亚描述多重估算后的数据(我应该使用哪个数据集)?

如何使用阿米莉亚描述多重估算后的数据(我应该使用哪个数据集)?
EN

Stack Overflow用户
提问于 2019-08-29 13:20:08
回答 1查看 340关注 0票数 0

我使用以下代码使用艾米莉亚进行了多次估算

代码语言:javascript
复制
binary<- c("Gender",  "Diabetes")
exclude.from.IMPUTATION<-c( "Serial.ID")
NPvars<- c("age",  "HDEF","BMI")#a skewed (non-parametric variable

a.out <- Amelia::amelia(x = for.imp.data,m=10,
                idvars=exclude.from.IMPUTATION,
                noms = binary, logs =NPvars)
summary(a.out)

## save imputed datasets ##
Amelia::write.amelia(obj=a.out, file.stem = "impdata", format = "csv")

我有10个不同的输出数据csv文件(如下图所示)

我知道我可以使用它们中的任何一个来进行描述性分析,如以前的问题所示,但是

  1. 如果我们要使用其中的任何一个文件,我们为什么要做多个归罪?
  2. 一些作者报告说,使用Rubin的规则来总结不同的估算,如这里所示,请提供如何这样做的建议。

EN

回答 1

Stack Overflow用户

发布于 2020-12-29 17:44:04

您不能只使用这些数据集中的一个。正如你正确地指出的,那么整个多重归责的过程将是无用的。

正如jay.sf所说,不同的数据集表达了归责的不确定性。丢失的数据最终会丢失--我们只能估计真实的数据会是什么样子。通过多次计算,我们产生了多个估计,真实的数据会是什么样子。总的来说,这可以用来说这样的话:丢失的数据很可能介于.还有..。

当您生成描述性统计信息时,您将分别为每个推测的数据集生成这些统计信息。例如,从平均值的角度来看,您可以提供作为附加信息的数据集上的最低平均值和最高平均值。您可以提供这些平均值的平均值和计算出的数据集的平均值的标准差。这样,你的读者就会知道,这种归罪带来了多少不确定性。

您还可以使用您的估算数据集来描述线性模型输出的不确定性。您可以使用Rubin的规则(RR)来汇集参数估计,如均值差异、回归系数、标准误差,并导出置信区间和p值。(另见https://bookdown.org/mwheymans/bookmi/rubins-rules.html)

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57711161

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档