我真的不太明白实际分配的区别= Adaboost或bernoulli
library(MASS)
library(gbm)
data=Boston
data$chas = factor(data$chas)
ada_model = gbm(chas~ . , data, distribution ='adaboost')
bern_model = gbm(chas ~ . , data, distribution = 'bernoulli')
ada_model
bern_model我不明白为什么伯努利没有给出任何结果?我想我对它的工作原理有一个根本性的误解?
我在寻找: 1.解释为什么bernoulli不能工作。我以为文档说这可以用于分类? 2。如果它们都可以用于分类,实际区别是什么?
发布于 2015-11-18 08:10:20
伯努利正在为您打破,因为factor调用将0/1重新编码为1/2:
> str(factor(data$chas[350:400]))
Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 2 2 2 ...发布于 2016-05-25 05:58:01
> str(data$chas)
int [1:506] 0 0 0 0 0 0 0 0 0 0 ...
> sum(data$chas==0) + sum(data$chas==1)
[1] 506当前有506个整数,它们要么都是0,要么都是1。没什么可做的。根据@Neal Fultz在他的原始评论中的建议和在他的回答中的解释,删除第4行。如果您希望显式地将变量绑定到{0,1},则可以使用as.logical,您的代码将变为:
library(MASS)
library(gbm)
data=Boston
data$chas = as.logical(data$chas) # optionally cast as logical to force range into 0 or 1
ada_model = gbm(chas~ . , data, distribution ='adaboost')
bern_model = gbm(chas ~ . , data, distribution = 'bernoulli')
ada_model
bern_model从字里行间读出一点,我猜你真正的问题是你的生产数据集的值不是{0,1}。将它们转换为logical会将它们转换为TRUE (1),然后就可以开始使用了。如果这不是你想要的,那么使用这个来找到它们并逐个检查它们:
which((data$chas != 0) & (data$chas != 1))https://stackoverflow.com/questions/33763428
复制相似问题