RPART对连续变量、序数变量和范畴变量使用不同的分裂过程。是否有办法“通知”RPART有关变量类型的信息?为了举例说明,我有一个带有整数值的序数变量(1,..,5)。现在,我需要将它强制转换为字符,这样RPART就不会像一个连续变量那样分割它。
我不想只为RPART更改我的所有变量类型。不知何故,我宁愿声明一下。
谢谢。
发布于 2014-04-24 22:42:49
问题是R如何知道foo <- c(1,2,3,2,4,5,1,5) (例如)不是数值变量?如果您查看foo类,您将看到它是数字的。
R> class(foo)
[1] "numeric"问题是,在一个非常基本的层次上,您没有告诉R数据类型是什么。在这种情况下,简单的解决方案不是将其转换为字符向量,而是将其转换为有序因子。如果仅仅是因为这是数据!rpart应该获取因子方面并相应地处理它。
因此,通知rpart变量是序数的方法是告诉R它是序数。
foo <- as.ordered(foo)
R> foo
[1] 1 2 3 2 4 5 1 5
Levels: 1 < 2 < 3 < 4 < 5我怀疑你遗漏了R的其他特性,因为你没有告诉它数据的性质。R是在做一个不正确的假设。
https://stackoverflow.com/questions/23280959
复制相似问题