我使用Apache Spark Mllib 1.4.1 (PySpark,Spark的python实现)根据我拥有的LabeledPoint数据生成决策树。树可以正确生成,我可以使用以下命令将其打印到终端(提取规则,该用户将其称为How to extract rules from decision tree spark MLlib):
model = DecisionTree.trainClassifier( ... )
print(model.toDebugString()但我想要做的是可视化或绘制决策树,而不是将其打印到终端。有没有什么方法可以在PySpark中绘制决策树,或者可以保存决策树数据并使用R绘制它?谢谢!
发布于 2016-06-01 16:21:08
有一个用于可视化决策树模型的项目Decision-Tree-Visualization-Spark
它有两个步骤
有关解析器,请查看Dt.py
函数def tree_json(tree)的输入是您的模型toDebugString()
来自question的答案
发布于 2017-10-10 13:11:43
虽然这是一个有点老的帖子,但只是为了提供我的答案,以便从现在开始阅读这篇文章的其他人可以受益。
或者,您可以在PySpark中使用"graphviz" python包。它将把决策树模型打印成一个整洁的树结构,而不是通常的if循环结构。
欲了解更多详情,请访问以下链接:https://pypi.python.org/pypi/graphviz
https://stackoverflow.com/questions/31853979
复制相似问题