首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >带虚拟变量的多元Logistic回归

带虚拟变量的多元Logistic回归
EN

Stack Overflow用户
提问于 2019-02-28 12:12:48
回答 1查看 485关注 0票数 2

我将在序言中说,我对R相当陌生,在这个问题上被困了几个星期,而且似乎没有进展。我希望进行多变量logistic回归,以确定水的主要物质和土壤类型是否在我的研究区域的水主断裂的位置发挥一个因素。

我有417个正水主断裂位置,并在我的分析中创建了另外400个假位置。我知道,水主料和土壤类型都是分类变量,在使用GLM模型之前,应该将它们重新编码成虚拟变量。那就是我遇到麻烦的地方。到目前为止,我还没有使用虚拟变量,并且似乎无法理解它们是如何在R中创建的。下面是我所拥有的数据的分解以及我正在使用的GLM模型。

指示符:0或1(指示XY是否为水主断裂位置)

主要材料:位于XY位置的主水管材料(分类值-约8个独特值)

土壤分类:破碎处土壤类型(分类值-约20值)

( glm(Indicator~main_material+soil_classification,data=Breaks,family=binomial (link="logit"))

我只使用过一次堆栈交换,所以如果需要更多的信息,请告诉我。

在尝试了Aurther关于使用factor()的建议之后,这就是我得到的输出。R输出

我有点困惑,为什么许多土壤分类和PE的主要物质有这么高的性病。错误。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-02-28 12:15:29

factor()是R的“虚拟变量”尝试:

代码语言:javascript
复制
(logAnalysis <- glm(Indicator~main_material+factor(soil_classification), data=Breaks, family=binomial(link="logit"))
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54925480

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档