首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Kubeflow流水线存储(传递) TF.Dataset

Kubeflow流水线存储(传递) TF.Dataset
EN

Stack Overflow用户
提问于 2019-05-28 19:38:24
回答 2查看 242关注 0票数 0

我正在使用Kubeflow Pipeline,我想要实现的是有一个步骤(python函数),在这个步骤中我创建了一个Iterator (generator),我想从这个步骤创建一个TF.Dataset

Kubeflow步骤之间的连接仅允许具有原语类型的输入/输出,因此我无法将迭代器或迭代器初始化数据集传递到下一步。

这是管道的概述

代码语言:javascript
复制
+-------------+   +-------------------+   +------------------------------+
| Data Ingest +---> Create TF.Dataset +---> Consume Tf.Dataset in Model  |
+-------------+   +-------------------+   +------------------------------+

由于我只能传递基元类型,是否有可能存储迭代器初始化的Dataset?

数据存储在Google Storage上,大小不足以放入内存,怎么会有人做到这一点呢?

我知道这是一个宽泛的问题,但由于Kubeflow是相当新的,我在任何地方都找不到任何有用的资源。

EN

回答 2

Stack Overflow用户

发布于 2019-06-05 02:25:43

有什么特别的理由要把“创建TF.Dataset”和“消费Tf.Dataset”分成两步吗?1.将它们合并成一个步骤如何? 2.通过“将数据集写入存储”/“从存储读取数据集”来共享数据集?

票数 0
EN

Stack Overflow用户

发布于 2020-07-10 17:59:57

您将TF数据集存储在哪里?

建议:在创建TF数据集时将其存储在GCS中。然后在下一个管道阶段使用tf.data.TFRecordDataset读取数据。

管道中的各个阶段具有不同的运行时。所以,你不能从一个流水线阶段到另一个阶段使用任何变量。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56341401

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档