我正在阅读下面的网站为决策树分类部分。http://spark.apache.org/docs/latest/mllib-decision-tree.html
我将提供的示例代码内置到我的笔记本电脑中,并试图理解它的输出。但我一点也听不懂。下面是代码,sample_libsvm_data.txt可以在data.txt下面找到
请参考输出,并让我知道我的意见是否正确。这是我的意见。
发布于 2016-03-21 12:48:07
我相信你是对的。是的,您的错误率约为5%,所以您的算法大约95%的时间是正确的30%的数据,你保留作为测试。根据您的输出(我将假设它是正确的,我没有亲自测试代码),是的,确定观察的类的唯一特性是Feature434,如果它小于0时,则为0,否则1。
发布于 2016-04-15 01:53:51
为什么在Spark中,在训练决策树模型时,不使用每个节点的minInfoGain或最小实例数来控制树的增长?这棵树很容易过度生长。
https://stackoverflow.com/questions/36126223
复制相似问题