首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >GCP数据流计算图与作业执行

GCP数据流计算图与作业执行
EN

Stack Overflow用户
提问于 2021-08-14 01:18:58
回答 1查看 178关注 0票数 0

大家好,当我在中创建一个自定义模板时,我尽力去理解正在发生的事情,但是没有理解。多亏了GCP文件。以下是我正在取得的成就。

从Google Bucket

  • Pre-Process predictions

  • Dump it

  • Load Deeplearning (各1GB)读取数据,并在BigQuery.

中获取结果。

我成功地创建了模板,并且能够执行任务。但我有以下问题。

  1. 在执行作业时,每次在执行期间下载模型(5个模型和每个模型),模型被加载并放置在模板(执行图)中,在执行过程中使用加载的模型(
  2. ),如果模型的加载只发生在作业执行期间,那么它不会影响执行时间吗?由于每次作业是triggered?
  3. Can时都要加载模型文件的GBs,所以多个用户同时触发相同的模板?因为我想生产它,所以我不确定它将如何同时处理多个请求?

有谁能分享一下这方面的信息吗?

我提到的来源,但没有得到答案:https://cloud.google.com/dataflow/docs/guides/deploying-a-pipeline#pipeline-lifecycle-from-pipeline-code-to-dataflow-job http://alumni.media.mit.edu/~wad/magiceight/isa/node3.html https://cloud.google.com/dataflow/docs/guides/setting-pipeline-options#configuring-pipelineoptions-for-local-execution https://beam.apache.org/documentation/basics/ https://beam.apache.org/documentation/runtime/model/ https://mehmandarov.com/apache-beam-pipeline-graph/

EN

回答 1

Stack Overflow用户

发布于 2021-08-16 18:12:27

这取决于模型从哪里加载。如果它们加载在DoFns中(很可能),那么它将发生在工人中(在作业执行期间)。

至于您的另一个问题,多个用户同时触发模板作业不应该出现问题。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68779663

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档