我正在分析捕食者在什么地方遇到潜在的猎物。我的响应数据是二进制的,有一个相遇位置=1和一个随机位置=0,并且我的自变量是连续的,但是已经被重新标度了。
我最初使用的是GLM结构
glm_global <- glm(Encounter ~ Dist_water_cs+coverMN_cs+I(coverMN_cs^2)+
Prey_bio_stand_cs+Prey_freq_stand_cs+Dist_centre_cs,
data=Data_scaled, family=binomial)但意识到这没有考虑到数据中潜在的空间自相关(样条相关图显示了高达1000米的高残留相关性)。
Correlog_glm_global <- spline.correlog (x = Data_scaled[, "Y"],
y = Data_scaled[, "X"],
z = residuals(glm_global,
type = "pearson"), xmax = 1000)我试图通过将捕食者群作为随机效应来实现GLMM (在lme4中)来解释这一点。
glmm_global <- glmer(Encounter ~ Dist_water_cs+coverMN_cs+I(coverMN_cs^2)+
Prey_bio_stand_cs+Prey_freq_stand_cs+Dist_centre_cs+(1|Group),
data=Data_scaled, family=binomial)当将全局GLMM (1144.7)和全局GLM (1149.2)的AIC值进行比较时,得到的增量AIC值大于2,说明GLMM更适合于数据。然而,在残差中,我仍然得到了本质上相同的相关性,如GLMM模型的样条相关图所示)。
Correlog_glmm_global <- spline.correlog (x = Data_scaled[, "Y"],
y = Data_scaled[, "X"],
z = residuals(glmm_global,
type = "pearson"), xmax = 10000)我也尝试将所有位置的Lat*Long显式地作为自变量,但是结果是相同的。在阅读了选项之后,我尝试在“geepack”中运行广义估计方程(GEEs),认为这将允许我更灵活地明确定义相关结构(就像通常分布的响应数据的GLS模型中的那样),而不是局限于复合对称(这就是我们在GLMM中得到的)。然而,我意识到我的数据仍然需要使用复合对称(或geepack中的“可交换”),因为数据中没有时间序列。当我运行全局模型时
gee_global <- geeglm(Encounter ~ Dist_water_cs+coverMN_cs+I(coverMN_cs^2)+
Prey_bio_stand_cs+Prey_freq_stand_cs+Dist_centre_cs,
id=Pride, corstr="exchangeable", data=Data_scaled, family=binomial)(使用缩放或非缩放的数据没有什么区别,因此这与缩放数据保持一致)突然之间,我的协变量中没有一个是显着的。然而,作为一个刚开始使用GEE建模的新手,我不知道:( a)这是一种有效的数据方法,还是( b)这是否考虑到了自始至终都很明显的残留自相关。
如果我意识到GLMM模型(以捕食者群为随机效应)仍然显示空间自相关Pearson残差(高达1000米),2)如果GEE模型在这一点上确实是有意义的,3)如果我在GEE模型中遗漏了什么,我将非常感激地收到一些建设性的反馈。非常感谢。
发布于 2018-11-10 18:29:04
考虑到空间自相关,在你的模型中可以做的方法很多。我将抑制我的反应R主要包,处理随机效应。
首先,您可以使用包nlme,并在您的剩余值中指定一个相关结构(许多都可用: corGaus、corLin、CorSpher .)。你应该尝试其中的许多,并保持最好的模式。在这种情况下,空间自相关被认为是连续的,可以用一个整体函数来近似。
其次,您可以使用包mgcv,并向模型中添加一个二元样条(空间坐标)。这样,您就可以捕获一个空间模式,甚至映射它。在严格意义上,该方法不考虑空间自相关性,但可以解决这一问题。如果空间在你的情况下是离散的,你可以用随机马尔可夫场平滑。这个网站很有帮助,可以找到一些例子:https://www.fromthebottomoftheheap.net
第三,您可以使用包brms。这允许您在残差(CAR和SAR)中指定具有其他相关结构的非常复杂的模型。这个包使用了贝叶斯方法。
我希望这能帮上忙。祝好运
https://stackoverflow.com/questions/53185550
复制相似问题