我一直试图在Kaggle的数据上用老鼠进行实验,但在归类变量的估算上遇到了麻烦。我正在写这个笔记本- https://www.kaggle.com/rtatman/animal-bites,并试图预测物种(SpeciesIDDesc)。然而,在我运行鼠标之后,NA值都没有改变。下面是我现在拥有的代码。
library(tidyverse)
library(lubridate)
library(mice)
#kaggle link with data - https://www.kaggle.com/rtatman/animal-bites
data <- read_csv("Health_AnimalBites.csv",
col_types = list(BreedIDDesc = col_character(),
release_date = col_datetime()))
data_mice_one <- data %>%
filter(!is.na(victim_zip),
!is.na(bite_date),
!is.na(victim_zip),
!is.na(WhereBittenIDDesc)) %>%
mutate(month = month(bite_date, label = TRUE)) %>%
select(SpeciesIDDesc,
victim_zip,
month)
imputed_data_one <- mice(data_mice_one, diagnostics = FALSE, remove_collinear = FALSE, meth="polyreg")
imputed_data_one <- complete(imputed_data_one)
view(imputed_data_one)
sum(is.na(imputed_data_one$SpeciesIDDesc))在运行'imputed_data_one <- mice(data_mice_one,diagnostics = FALSE,remove_collinear = FALSE,meth="polyreg")‘后,我也收到了一条警告消息,显示"Warning message: Number of logged events: 2“在调查记录的事件时-
它表示1 0 0常量SpeciesIDDesc 2 0 0常量victim_zip
我如何修复我的代码?我是不是错误地使用了鼠标?
发布于 2020-04-27 09:59:46
我刚刚意识到我忘了把SpeciesIDDesc和month转换成因子。代码现在可以工作了
https://stackoverflow.com/questions/61448882
复制相似问题