当我为木星笔记本安装PySpark时,我使用以下cmd:
jupyter toree install --kernel_name=tanveer --interpreters=PySpark --python="/usr/lib/python3.6"但是,我知道
[ToreeInstall] ERROR | Unknown interpreter PySpark. Skipping installation of PySpark interpreter所以我不知道有什么问题。我已经成功地设置了Toree的Scala和SQL。认为
发布于 2019-03-23 14:13:36
Toree版本0.3.0删除了对PySpark和SparkR的支持:
删除Toree中对PySpark和Spark的支持(使用特定的内核)
这里的发布说明:孵化器-toree发布说明
我不知道“使用特定内核”意味着什么,并继续寻找木星PySpark内核。
发布于 2019-08-23 13:14:25
正如Lee的回答中所提到的,Toree版本0.3.0删除了对PySpark和SparkR的支持。根据他们的发布说明,他们要求“使用特定的内核”。对于PySpark,这意味着手动安装拟与木星一起使用的火花放电。
步骤简单如下:
pip install pyspark或通过下载Apache二进制包并将其解压缩到特定的文件夹。~/.bash_profile中添加了以下行
出口SPARK_HOME= PYSPARK_DRIVER_PYTHON="jupyter“出口PYSPARK_DRIVER_PYTHON_OPTS=”笔记本“就这样。要启动PySpark朱庇特笔记本,只需从命令行中运行"pyspark“,然后选择”Python内核“。
请参阅
intelligence/9781788835367/1/ch01lvl1sec17/installing-jupyter
或
https://opensource.com/article/18/11/pyspark-jupyter-notebook
更详细的说明。
https://stackoverflow.com/questions/55174922
复制相似问题