首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >星火ML决策树如何处理回归问题的连续特征

星火ML决策树如何处理回归问题的连续特征
EN

Stack Overflow用户
提问于 2017-06-02 15:24:47
回答 1查看 1.7K关注 0票数 1

我有一个分类和连续的混合特征。我已经索引了我所有的分类变量,我使用VectorAssembler创建了一个特性列

代码语言:javascript
复制
        StringIndexerModel indexer = new StringIndexer()
                    .setInputCol("categorical")
                    .setOutputCol("categoricalIdx1")
                    .setHandleInvalid("skip").fit(data);
        VectorAssembler assembler = new VectorAssembler()
                    .setInputCols(new String[]{"categoricalIdx1","continuous"})
                    .setOutputCol("features");

        DecisionTreeRegressor dt = new DecisionTreeRegressor()
                                       .setMaxBins(40)
                                       .setMaxDepth(10)
                                       .setFeaturesCol("features")
                                       .setLabelCol("commission")
                                       .setPredictionCol("prediction");

我找不到任何方法来指定哪些特性是绝对的,哪些是连续的。既然所有的列都被转换成数值,那么DecisionTreeRegressor如何知道它们之间的区别。我在这里错过了什么?这段代码看起来很有效,并给出了很好的效果,但是我有一种预感,我在这里做了一些错误的事情。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-07-04 15:34:19

Spark使用MaxBins指定一个功能是绝对的或连续的。如果不同值的数量<= MaxBins,则为绝对值。否则是连续的。有关更多信息,请查看星火的文档:决策树

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44332417

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档