文章/答案/技术大牛

发布

社区首页 >问答首页 >如何在分类任务中解释Sparkling Water的GBM算法结果

问如何在分类任务中解释Sparkling Water的GBM算法结果
EN

Stack Overflow用户

提问于 2017-04-24 22:55:00

回答 1查看 190关注 0票数 1

我刚接触汽水和机器学习

我已经使用两个数据集构建了GBM模型，这两个数据集手动分为训练和测试。任务是具有所有数字属性的分类(响应列转换为枚举类型)。代码在Scala中。

val gbmParams = new GBMParameters()
  gbmParams._train = train
  gbmParams._valid = test
  gbmParams._response_column = "response"
  gbmParams._ntrees = 50
  gbmParams._max_depth = 6

val gbm = new GBM(gbmParams)
val gbmModel = gbm.trainModel.get

在模型总结中，我得到了四种不同的模型-一个基于训练数据，另一个基于测试数据，然后构建具有预测功能的单个树。结果是在每种情况下预测值都为1-这是针对测试数据的：

CM: Confusion Matrix (vertical: actual; across: predicted):
       0    1   Error       Rate
    0  0  500  1,0000  500 / 500
    1  0  300  0,0000    0 / 300
Totals 0  800  0,6250  500 / 800

对于训练数据，第二个混淆矩阵与预测值相似，每种情况下都为1。构建树后的第三和第四个混淆矩阵得到正常结果，值分布在矩阵的所有部分。

我需要解释第一个和第二个矩阵。为什么Sparkling Water要这么做？我可以使用这些结果吗，或者这只是一个中间步骤？

谢谢。

scala

h2o

gbm

sparkling-water

回答 1

Stack Overflow用户

发布于 2017-04-25 00:20:42

解释矩阵如下所示：

CM: Confusion Matrix (vertical: actual; across: predicted):
       0    1   Error       Rate
    0  0  500  1,0000  500 / 500
    1  0  300  0,0000    0 / 300
Totals 0  800  0,6250  500 / 800

我们可以看到，所有800个观察值都被标记为1，这是由Totals行中的数字给出的。

被测试的模型预测0为500倍，预测1为300倍。这给出了0.625或62.5%的总体误差。

这告诉我们两件事：

数据集中的数据完全不平衡，偏向于类，模型做得很糟糕，1.

The，，
，

，

有没有可能这两个初始矩阵代表了一个未经训练的模型的汇总，本质上是随机挑选类？后两个矩阵表示训练模型的汇总？

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/43591430

复制

相似问题

问如何在分类任务中解释Sparkling Water的GBM算法结果
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在分类任务中解释Sparkling Water的GBM算法结果EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在分类任务中解释Sparkling Water的GBM算法结果
EN