我将在序言中说,我对R相当陌生,在这个问题上被困了几个星期,而且似乎没有进展。我希望进行多变量logistic回归,以确定水的主要物质和土壤类型是否在我的研究区域的水主断裂的位置发挥一个因素。
我有417个正水主断裂位置,并在我的分析中创建了另外400个假位置。我知道,水主料和土壤类型都是分类变量,在使用GLM模型之前,应该将它们重新编码成虚拟变量。那就是我遇到麻烦的地方。到目前为止,我还没有使用虚拟变量,并且似乎无法理解它们是如何在R中创建的。下面是我所拥有的数据的分解以及我正在使用的GLM模型。
指示符:0或1(指示XY是否为水主断裂位置)
主要材料:位于XY位置的主水管材料(分类值-约8个独特值)
土壤分类:破碎处土壤类型(分类值-约20值)
( glm(Indicator~main_material+soil_classification,data=Breaks,family=binomial (link="logit"))
我只使用过一次堆栈交换,所以如果需要更多的信息,请告诉我。
在尝试了Aurther关于使用factor()的建议之后,这就是我得到的输出。R输出
我有点困惑,为什么许多土壤分类和PE的主要物质有这么高的性病。错误。
发布于 2019-02-28 12:15:29
factor()是R的“虚拟变量”尝试:
(logAnalysis <- glm(Indicator~main_material+factor(soil_classification), data=Breaks, family=binomial(link="logit"))https://stackoverflow.com/questions/54925480
复制相似问题