文章/答案/技术大牛

发布

社区首页 >问答首页 >如何使用kedro写入HDFS

问如何使用kedro写入HDFS
EN

Stack Overflow用户

提问于 2022-05-04 19:28:55

回答 2查看 124关注 0票数 1

我正在尝试将我的Kedro管道输出到HDFS文件系统。但我无法在互联网上看到如何做到这一点，也无法在Kedro文档上看到。如果有人在目录中配置了kedro，请共享一个示例代码，如何做到这一点。

还如何使用凭据安全地连接hdfs

我有熊猫的数据。

这个catalog.yml的条目是什么样的，我在哪里提到凭据？

hdfs

pipeline

kedro

python

回答 2

Stack Overflow用户

发布于 2022-05-04 19:47:18

在目录中，您可以像hdfs://user@server:port/path/to/data那样定义filepath。

https://kedro.readthedocs.io/en/stable/data/data_catalog.html#specifying-the-location-of-the-dataset

票数 0

Stack Overflow用户

发布于 2022-05-04 20:34:22

假设您可以从外部Kedro (独立火花)写到hdfs，这应该是直接从Kedro。

在目录文件中使用sparkDataSet，并在spark.yml中定义诸如单元格、元存储等属性，这应该是它。

然后，就像上面提到的Rahul一样，您需要指定要写入的hdfs位置的完整路径，如果您仍然面临问题，请共享一些快照。

dataset_name:
  type: spark.SparkDataSet
  filepath: hdfs://your_bucket/location/file.parq

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/72118483

复制

相似问题

问如何使用kedro写入HDFS
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用kedro写入HDFSEN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用kedro写入HDFS
EN