我想映射函数pdp::偏于嵌套的randomForest模型。然后,我将使用输出来通过facet_wrap()绘制每个组的3d部分依赖图。当将函数映射到模型时,我得到一个错误,即在训练数据中找不到预测变量--但是当我检查tibble时,它们就在那里了,所以我不知所措。
library(tidyverse)
library(pdp)
library(randomForest)
data(boston)
glimpse(boston)
#Make groups, nest data by groups, apply random forest model to nested data
boston %>%
mutate(grp=ifelse(age<80, "young", "old"))%>%
nest(data= -grp)%>%
mutate(fit = map(data, ~ randomForest(cmedv ~ ., data = boston, importance = TRUE)))%>%
{.->>GrpModels}
#Map pdp::partial to fitted models for two predictor variables
GrpModels%>%
mutate(p=map2(fit,data, ~pdp::partial(fit,train=data, pred.var=c("lstat", "rm"))))%>%
unnest(p)%>%{.->>checkpdp}错误:
mutate()列p的问题。Ip = map2(...)。在训练数据中找不到x lstat,rm。
。
发布于 2021-09-30 14:53:00
这似乎是可行的,尽管我不知道为什么用geom_tile()绘图并不能像我想象的那样做得很好。我用的是geom_point()。简而言之,我需要将pred.var作为一个列表,然后将三个输入(fit、data和predictor变量)传递给pmap。
GrpModels %>%
mutate(preds = data.table::transpose(as.list(c('lstat','rm')))) %>%
mutate(p = pmap(list(fit, data, preds),
.f = ~pdp::partial(object=..1, train = ..2,
pred.var = ..3)))%>%
select(-data,-fit,-preds)%>%
unnest_wider(p)%>%
unnest(c(yhat,lstat,rm))%>%{.->>checkpdp}%>%
ggplot(.,aes(x=lstat,y=rm,color=yhat))+
#geom_tile()+
geom_point(shape=15, size=2)+
facet_wrap(~grp, scales='free')https://stackoverflow.com/questions/69382651
复制相似问题