我刚接触汽水和机器学习
我已经使用两个数据集构建了GBM模型,这两个数据集手动分为训练和测试。任务是具有所有数字属性的分类(响应列转换为枚举类型)。代码在Scala中。
val gbmParams = new GBMParameters()
gbmParams._train = train
gbmParams._valid = test
gbmParams._response_column = "response"
gbmParams._ntrees = 50
gbmParams._max_depth = 6
val gbm = new GBM(gbmParams)
val gbmModel = gbm.trainModel.get在模型总结中,我得到了四种不同的模型-一个基于训练数据,另一个基于测试数据,然后构建具有预测功能的单个树。结果是在每种情况下预测值都为1-这是针对测试数据的:
CM: Confusion Matrix (vertical: actual; across: predicted):
0 1 Error Rate
0 0 500 1,0000 500 / 500
1 0 300 0,0000 0 / 300
Totals 0 800 0,6250 500 / 800对于训练数据,第二个混淆矩阵与预测值相似,每种情况下都为1。构建树后的第三和第四个混淆矩阵得到正常结果,值分布在矩阵的所有部分。
我需要解释第一个和第二个矩阵。为什么Sparkling Water要这么做?我可以使用这些结果吗,或者这只是一个中间步骤?
谢谢。
发布于 2017-04-25 00:20:42
解释矩阵如下所示:
CM: Confusion Matrix (vertical: actual; across: predicted):
0 1 Error Rate
0 0 500 1,0000 500 / 500
1 0 300 0,0000 0 / 300
Totals 0 800 0,6250 500 / 800我们可以看到,所有800个观察值都被标记为1,这是由Totals行中的数字给出的。
被测试的模型预测0为500倍,预测1为300倍。这给出了0.625或62.5%的总体误差。
这告诉我们两件事:
数据集中的数据完全不平衡,偏向于类,模型做得很糟糕,1.
,
有没有可能这两个初始矩阵代表了一个未经训练的模型的汇总,本质上是随机挑选类?后两个矩阵表示训练模型的汇总?
https://stackoverflow.com/questions/43591430
复制相似问题