我正在尝试使用tidymodels计算线性模型上的变量重要性。据我所知,在使用tidymodels时,vip包用于提取重要性。例如,如果我想从随机森林tidymodels模型中提取重要性,我将执行以下操作:
library(tidymodels)
aq <- na.omit(airquality)
model_rf <-
rand_forest(
mode = "regression"
) %>%
set_engine("ranger",
importance = "permutation"
) %>%
fit(Ozone ~ ., data = aq)
# variable importance
vip:::vi(model_rf)这将返回重要性。但是,如果我使用线性模型尝试类似的操作,它会抛出一个错误。例如:
# create model fit
lm_aq_model <- linear_reg() %>%
set_engine("lm")
lm_fit <- lm_aq_model %>%
fit(Ozone ~ ., data = aq)
vip:::vi(lm_aq_model, method = "permute", target = "Ozone",
metric = "rsquared", pred_wrapper = predict)
> Error in match.call(f, call = mcall) : invalid 'call' argument我在这里做错了什么?如果我尝试:
aqLM <- lm(Ozone~., data = aq)
vip::vi(aqLM, method = "permute", target = "Ozone",
metric = "rsquared", pred_wrapper = predict)这行得通..。为什么我不能让它与tidymodels一起工作
另外,这是在使用tidymodels时实际提取重要性的首选方法吗?有没有一个通用的整洁模型函数可以用来代替vip::vi(model_fit)
谢谢
发布于 2021-03-22 04:52:44
看起来你给了它错误的东西,为什么不给它一个合适的呢?这就是RF示例所做的事情。
vip:::vi(lm_fit, method = "permute", target = "Ozone",
metric = "rsquared", pred_wrapper = predict)https://stackoverflow.com/questions/66737369
复制相似问题