首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Kedro0.16.3和kedro[spark.SparkDataSet] pip库不能一起安装在databricks集群上

Kedro0.16.3和kedro[spark.SparkDataSet] pip库不能一起安装在databricks集群上
EN

Stack Overflow用户
提问于 2022-05-25 11:07:01
回答 2查看 244关注 0票数 0

直到上周,kedro和kedrospark.SparkDataSet pip库都安装在集群上。但由于过去3-4天,他们将不会一起安装在集群上。它显示它是一个重复的库,但是我的代码也失败了,因为它找不到闪烁数据集。如果我只安装kedro,就会得到错误,如下面的屏幕截图错误所示

EN

回答 2

Stack Overflow用户

发布于 2022-05-25 12:10:40

要安装kedro,请遵循以下安装先决条件

安装Kedro

要从(PyPI)中安装Kedro,只需运行:

代码语言:javascript
复制
pip install kedro

样本代码-

代码语言:javascript
复制
from pyspark.sql import SparkSession
from pyspark.sql.types import (StructField, StringType,
                               IntegerType, StructType)

from kedro.extras.datasets.spark import SparkDataSet

schema = StructType([StructField("name", StringType(), True),
                     StructField("age", IntegerType(), True)])

data = [('Alex', 31), ('Bob', 12), ('Clarke', 65), ('Dave', 29)]

spark_df = SparkSession.builder.getOrCreate().createDataFrame(data, schema)

data_set = SparkDataSet(filepath="test_data")
data_set.save(spark_df)
reloaded = data_set.load()

reloaded.take(4)

票数 0
EN

Stack Overflow用户

发布于 2022-05-25 13:25:57

您不需要安装两个pip install kedro["spark.SparkDataSet"]==0.16.3都是pip install kedro==0.16.3的超集

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72376493

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档