首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >GLM模型在交互代码中运行,但当我使用针织品时却不能运行。

GLM模型在交互代码中运行,但当我使用针织品时却不能运行。
EN

Stack Overflow用户
提问于 2020-08-27 12:44:47
回答 2查看 362关注 0票数 3

我对knitr有意见。具体来说,我有一个在控制台中运行非常好的模型,但是当我试图编织文档时,R会抛出一个错误。

加载数据集(在这里可用,以便于复制。 )

代码语言:javascript
复制
scabies <- read.csv(file = "S1-Dataset_CSV.csv", header = TRUE, sep = ",")
scabies$agegroups <- as.factor(cut(scabies$age, c(0,10,20,Inf), labels = c("0-10","11-20","21+"), include.lowest = TRUE)) 
scabies$agegroups <-relevel(scabies$agegroups, ref = "21+")
scabies$house_cat <- as.factor(cut(scabies$house_inhabitants, c(0,5,10,Inf), labels = c("0-5","6-10","10+"), include.lowest = TRUE))
scabies$house_cat <- relevel(scabies$house_cat, ref = "0-5")
scabies <- scabies %>% mutate(scabies = case_when(scabies_infestation=="yes"~1,
                                                  scabies_infestation=="no"~0)) %>%
                      mutate(impetigo = case_when(impetigo_active=="yes" ~1,
                                                  impetigo_active=="no" ~0))

拟合模型

代码语言:javascript
复制
scabiesrisk <- glm(scabies~agegroups+gender+house_cat,data=scabies,family=binomial())
scabiesrisk_OR <- exp(cbind(OR= coef(scabiesrisk), confint(scabiesrisk)))
scabiesrisk_summary <- summary(scabiesrisk)
scabiesrisk_summary <- cbind(scabiesrisk_OR, scabiesrisk_summary$coefficients)
scabiesrisk_summary

这段代码在控制台中运行的非常好。但是当我尝试knitr时,我得到了:

model.frame.default中的错误(公式=疥疮~年龄组+性别+:变量'scabies调用的无效类型(列表):

EN

回答 2

Stack Overflow用户

发布于 2020-09-07 20:06:19

我能够重现您描述的问题,但还没有完全了解在引擎盖下发生了什么。

这个Markdown chunck很有趣:

代码语言:javascript
复制
```{r}

scabiesrisk_OR <- exp(OR=coef(疥疮风险),coef((疥疮风险)

scabiesrisk_summary <-摘要(疥疮风险)

scabiesrisk_summary <- cbind(scabiesrisk_OR,scabiesrisk_summary$coefficients)

scabiesrisk_summary

代码语言:javascript
复制

如果我手动快速执行一个接一个地执行chunck中的行(ctrl+Enter x 4),有时会得到两条分析消息:

代码语言:javascript
复制
Waiting for profiling to be done...
Waiting for profiling to be done...

在这种情况下,summary(scabiesrisk)是一个矩阵:

代码语言:javascript
复制
> class(scabiesrisk_summary)
[1] "matrix" "array" 

如果我手动缓慢地执行块中的行,我只收到一条分析消息:

代码语言:javascript
复制
Waiting for profiling to be done...

summary(scabiesrisk)是一个summary.glm

代码语言:javascript
复制
> class(scabiesrisk_summary)
[1] "summary.glm"

看起来分析是在一个单独的线程上启动的,根据它是否完成,摘要函数不具有相同的行为。如果分析完成,它将返回预期的summary.glm对象,但如果不是,则会启动另一个分析并返回一个矩阵。

特别是,由于矩阵scabiesrisk_summary$coefficients不可用,在这种情况下,我得到以下错误消息:

代码语言:javascript
复制
Error in scabiesrisk_summary$coefficients : 
  $ operator is invalid for atomic vectors

这也可能发生在编织过程中:编织开销是否会使分析速度变慢,从而导致问题的发生?

使用找到的解决方法这里 (使用confint.default而不是confint),我无法重现上面的问题:

代码语言:javascript
复制
scabiesrisk_OR <- exp(cbind(OR= coef(scabiesrisk), confint.default((scabiesrisk))))
scabiesrisk_summary <- summary(scabiesrisk)
scabiesrisk_summary <- cbind(scabiesrisk_OR, scabiesrisk_summary$coefficients)
scabiesrisk_summary
                       OR      2.5 %    97.5 %   Estimate Std. Error
(Intercept)    0.09357141 0.06984512 0.1253575 -2.3690303  0.1492092
agegroups0-10  2.20016940 1.60953741 3.0075383  0.7885344  0.1594864
agegroups11-20 2.53291768 1.79985894 3.5645415  0.9293719  0.1743214
gendermale     1.44749159 1.13922803 1.8391682  0.3698321  0.1221866
house_cat6-10  1.30521927 1.02586104 1.6606512  0.2663710  0.1228792
house_cat10+   1.17003712 0.67405594 2.0309692  0.1570355  0.2813713
                   z value     Pr(>|z|)
(Intercept)    -15.8772359 9.110557e-57
agegroups0-10    4.9442116 7.645264e-07
agegroups11-20   5.3313714 9.747386e-08
gendermale       3.0267824 2.471718e-03
house_cat6-10    2.1677478 3.017788e-02
house_cat10+     0.5581076 5.767709e-01

所以你也可以在你的情况下试试这个。

与直接可读的R函数confint.defaut相反,confint是一种S3分派方法(感谢@ Bolker提供了评论中的内部引用),我还没有进一步研究如何解释这种令人惊讶的行为。

另一个选项似乎将scabiesrisk_summary保存在另一个变量中。

我尽力了,但做完之后再也没能重现这个问题:

代码语言:javascript
复制
```{r}

scabiesrisk_OR <- exp(OR=coef(疥疮风险),coef((疥疮风险)

scabiesrisk_summary <-摘要(疥疮风险)

scabiesrisk_final <- cbind(scabiesrisk_OR,scabiesrisk_summary$coefficients)

scabiesrisk_final

代码语言:javascript
复制
票数 5
EN

Stack Overflow用户

发布于 2020-09-07 19:03:55

我强烈怀疑您忘记在脚本中包括library(tidyverse)。如果加载了tidyverse,那么您的代码可以正常工作。如果不是的话:

  • 尝试使用mutate() (并使用%>%)的步骤失败,因此从未在scabies数据集中创建scabies变量。
  • 然后glm(scabies ~ ...)将响应变量scabies解释为整个数据集,并抱怨响应变量为“无效类型(列表)”。

因此,在数据帧中避免使用与数据帧本身同名的变量是很好的做法.

您的数据转换步骤可以清理一点(as.factor()是多余的;您可以在单个mutate()调用中作为步骤执行所有转换;as.numeric(x=="yes")是将字符串转换为0/1变量的更短的方法.)如果要做更多的工作,我将编写一个自定义mycut()函数,它以断点和所需的引用级别作为输入参数,构造自定义标签,并进行发布。

代码语言:javascript
复制
library(tidyverse)
scabies <- (read.csv(file = "S1-Dataset_CSV.csv") %>%
            mutate(agegroups <- cut(age, c(0,10,20,Inf),
                                    labels = c("0-10","11-20","21+"),
                                    include.lowest = TRUE),
                   agegroups = relevel(agegroups, ref = "21+"),
                   house_cat = cut(house_inhabitants, c(0,5,10,Inf),
                                   labels = c("0-5","6-10","10+"),
                                   include.lowest = TRUE),
                   house_cat = relevel(house_cat, ref = "0-5"),
                   scabies = as.numeric(scabies_infestation=="yes"),
                   impetigo = as.numeric(impetigo_active=="yes"))
)
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63616289

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档