我已经尝试运行一个多变量数据集的Tukey HSD。但是,当我对单个变量运行相同的测试时,结果完全相反。
在运行多个变量时,我观察到在ANOVA输出中出现了以下错误:
87个影响中有8个是不可估计的估计影响可能是不平衡的
在运行单变量时,我观察到在ANOVA输出中出现了以下错误:
估计的影响可能是不平衡的
这与我收到的完全相反的Tukey HSD输出有任何关系吗?另外,我如何继续解决这个问题呢?
我使用了aov(),在我的数据集中有将近500000个数据点。
具体来说,下面的代码给了我一个不同的结果:
code1:
lm_test1 <- lm(y ~ x1+ x2, data=data)
glht(lm_test1, linfct = mcp(x1 = "Tukey"))code2:
lm_test1 <- lm(y ~ x1, data=data)
glht(lm_test1, linfct = mcp(x1 = "Tukey"))请告诉我这怎么可能..。
发布于 2016-04-21 06:06:37
经过进一步的研究,我找到了这个问题的答案,所以我想我应该把这个贴出来。R中的anova默认为-I Anova类型。这意味着我们输入的第一个变量,不考虑任何其他因素的影响,另一方面,对于其他变量,结果显示在控制了其他变量的影响之后。因此,由于我是输入我的变量作为第二个变量,结果显示是在控制后的第一个变量是偶然的,在一个完全相反的方向看一个直接的影响。
https://stackoverflow.com/questions/36693327
复制相似问题