首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在Apache Spark (PySpark 1.4.1)中可视化/绘制决策树?

如何在Apache Spark (PySpark 1.4.1)中可视化/绘制决策树?
EN

Stack Overflow用户
提问于 2015-08-06 18:58:22
回答 3查看 14.2K关注 0票数 11

我使用Apache Spark Mllib 1.4.1 (PySpark,Spark的python实现)根据我拥有的LabeledPoint数据生成决策树。树可以正确生成,我可以使用以下命令将其打印到终端(提取规则,该用户将其称为How to extract rules from decision tree spark MLlib):

代码语言:javascript
复制
model = DecisionTree.trainClassifier( ... )
print(model.toDebugString()

但我想要做的是可视化或绘制决策树,而不是将其打印到终端。有没有什么方法可以在PySpark中绘制决策树,或者可以保存决策树数据并使用R绘制它?谢谢!

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2016-06-01 16:21:08

有一个用于可视化决策树模型的项目Decision-Tree-Visualization-Spark

它有两个步骤

  • 将Spark决策树输出解析为JSON格式。
  • 将JSON文件用作D3.js Spark的输入

有关解析器,请查看Dt.py

函数def tree_json(tree)的输入是您的模型toDebugString()

来自question的答案

票数 7
EN

Stack Overflow用户

发布于 2017-10-10 13:11:43

虽然这是一个有点老的帖子,但只是为了提供我的答案,以便从现在开始阅读这篇文章的其他人可以受益。

或者,您可以在PySpark中使用"graphviz" python包。它将把决策树模型打印成一个整洁的树结构,而不是通常的if循环结构。

欲了解更多详情,请访问以下链接:https://pypi.python.org/pypi/graphviz

票数 2
EN

Stack Overflow用户

发布于 2020-09-21 22:05:45

我们刚刚发布了Spark1.1版本,支持dtreeviz的决策树。你可以可视化很多东西,比如整个树,仅仅是预测路径,树叶信息,比如样本数量或标准。

您可以在此notebook中检查许多可视化效果

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31853979

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档