我试图理解ctree是如何在所有预测器中完全不准确地拟合/预测观测的。例如,
library(partykit)
airq <- subset(airquality, !is.na(Ozone))
airq <- rbind(airq,data.frame(Ozone=rnorm(50),Solar.R=NA,Wind=NA,Temp=NA,Month=NA,Day=NA))
airct <- ctree(Ozone ~ ., data = airq,control = ctree_control(majority = TRUE))
table(tail(predict(airct,type="node"),50))最后50行airq缺少所有的预测器,通过阅读文档,我得到了这样的印象:使用majority=TRUE,它只会跟随大多数,这意味着它们都应该进入同一个节点,而不会有任何变化。但我得到了他们的预测分布。
所以
majority=TRUE工作原理的理解正确吗?顺便说一句,我试图跟踪代码以查看如何使用majority参数,并查看partykit:::.cnode中的行#104具有:
prob <- numeric(0) + 1L:length(prob) %in% which.max(prob)这在我看来相当奇怪,因为结果将永远是numeric(0)。
发布于 2016-09-02 10:11:44
这是/曾经是majority控件参数处理中的一个错误。它最近在released存储库中得到了修复(参见id=261),但尚未发布给CRAN。跑后
install.packages("partykit", repos = "http://R-Forge.R-project.org")一切都应如预期的那样运作。CRAN的发布日期还没有确定,但我认为不应该是太遥远的将来。
https://stackoverflow.com/questions/39261639
复制相似问题