首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用dtreeviz可视化决策树分类PySpark时的路径错误

用dtreeviz可视化决策树分类PySpark时的路径错误
EN

Stack Overflow用户
提问于 2022-06-26 10:10:59
回答 1查看 38关注 0票数 0

在实现代码时,我试图使用GitHub中的代码在以下链接https://github.com/parrt/dtreeviz/blob/master/notebooks/dtreeviz_spark_visualisations.ipynb中可视化决策树分类:

代码语言:javascript
复制
df = spark.read.parquet("../../dtreeviz/testing/testlib/models/fixtures/spark_3_0_decision_tree_classifier.model/training_df")

我得到了以下错误:

代码语言:javascript
复制
AnalysisException                         Traceback (most 
recent call last)
~\AppData\Local\Temp/ipykernel_12920/640132816.py in <module>
----> 1 df = spark.read.parquet("../../dtreeviz/testing/testlib/models/fixtures/spark_3_0_decision_tree_classifier.model/training_df")

C:\spark\spark-3.2.1-bin-hadoop2.7\python\pyspark\sql\readwriter.py in parquet(self, *paths, 
**options)
    299                        int96RebaseMode=int96RebaseMode)
    300 
--> 301         return self._df(self._jreader.parquet(_to_seq(self._spark._sc, paths)))
    302 
    303     def text(self, paths, wholetext=False, lineSep=None, pathGlobFilter=None,

C:\spark\spark-3.2.1-bin-hadoop2.7\python\lib\py4j-0.10.9.3-src.zip\py4j\java_gateway.py in 
__call__(self, *args)
   1319 
   1320         answer = self.gateway_client.send_command(command)
-> 1321         return_value = get_return_value(
   1322             answer, self.gateway_client, self.target_id, self.name)
   1323 

C:\spark\spark-3.2.1-bin-hadoop2.7\python\pyspark\sql\utils.py in deco(*a, **kw)
    115                 # Hide where the exception came from that shows a non-Pythonic
    116                 # JVM exception message.
--> 117                 raise converted from None
    118             else:
    119                 raise

AnalysisException: Path does not exist: file:/C:/Users/dtreeviz/testing/testlib/models/fixtures/spark_3_0_decision_tree_classifier.model/t 
raining_df

我遵循了这个链接https://github.com/parrt/dtreeviz中的所有说明

我在本地机器上找不到路径--我对代码做了什么感到困惑--因为我不熟悉Parquet格式,它看起来像路径,但是.model指的是什么呢?

EN

回答 1

Stack Overflow用户

发布于 2022-07-28 07:07:46

我在笔记本上看了看。实际上,它包含了一些用于开发/测试的不必要的代码。

在您的例子中,“df”数据不需要用于实际的可视化。您可以对其进行注释,并且可视化应该可以工作。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72760630

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档