首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Pachyderm管道不启动作业,并启动一个空的存储库

Pachyderm管道不启动作业,并启动一个空的存储库
EN

Stack Overflow用户
提问于 2018-12-31 21:15:47
回答 1查看 213关注 0票数 0

我在Pachyderm中的流水线上有一个JSON配置:

代码语言:javascript
复制
{
    "pipeline": {
        "name": "mopng-beneficiary-v2"
    },
    "input": {
        "pfs": {
            "repo": "mopng_beneficiary_v2",
            "glob": "/*"
        }
    },
    "transform": {
        "cmd": ["python3", "/pclean_phlc9h6grzqdhm6sc0zrxjne_UdOgg.py /pfs/mopng_beneficiary_v2/euoEQHIwIQTe1wXtg46fFYok.csv /pfs/mopng_beneficiary_v2//Users/aviralsrivastava/Downloads/5Feb18_master_ujjwala_latlong_dist_dno_so_v7.csv /pfs/mopng_beneficiary_v2//Users/aviralsrivastava/Downloads/ppac_master_v3_mmi_enriched_with_sanity_check.csv /pfs/mopng_beneficiary_v2/Qc.csv"],
        "image": "mopng-beneficiary-v2-image"
    }
}

我的docker文件如下所示:

代码语言:javascript
复制
FROM ubuntu:14.04

# Install opencv and matplotlib.
RUN apt-get update \
    && apt-get upgrade -y \
    && apt-get install -y unzip wget build-essential \
        cmake git pkg-config libswscale-dev \
        python3-dev python3-numpy python3-tk \
        libtbb2 libtbb-dev libjpeg-dev \
        libpng-dev libtiff-dev libjasper-dev \
        bpython python3-pip libfreetype6-dev \
    && apt-get clean \
    && rm -rf /var/lib/apt

RUN sudo pip3 install matplotlib
RUN sudo pip3 install pandas

# Add our own code.
ADD pclean.py /pclean.py

但是,当我运行我的命令来创建管道时:

代码语言:javascript
复制
pachctl create-pipeline -f https://raw.githubusercontent.com/avisrivastava254084/learning-pachyderm/master/pipeline.json

这些文件存在于pfs中:

代码语言:javascript
复制
pachctl put-file mopng_beneficiary_v2 master -f /Users/aviralsrivastava/Downloads/pclean_phlc9h6grzqdhm6sc0zrxjne_UdOgg.py
➜  ~ pachctl put-file mopng_beneficiary_v2 master -f /Users/aviralsrivastava/Downloads/5Feb18_master_ujjwala_latlong_dist_dno_so_v7.csv
➜  ~ pachctl put-file mopng_beneficiary_v2 master -f /Users/aviralsrivastava/Downloads/ppac_master_v3_mmi_enriched_with_sanity_check.csv
➜  ~ pachctl put-file mopng_beneficiary_v2 master -f /Users/aviralsrivastava/Downloads/euoEQHIwIQTe1wXtg46fFYok.csv

值得注意的是,我是从日志命令(pachctl get-logs --pipeline=mopng-beneficiary-v2)中获得的:

代码语言:javascript
复制
container "user" in pod "pipeline-mopng-beneficiary-v2-v1-lnbjh" is waiting to start: trying and failing to pull image
EN

回答 1

Stack Overflow用户

发布于 2019-09-25 23:23:58

正如Matthew L Daniel评论的那样,图像名称看起来很有趣,因为它没有前缀。默认情况下,Pachyderm从Dockerhub拉取Docker镜像,Dockerhub会在镜像前加上拥有它们的用户(例如maths/mopng-beneficiary-v2-image)

此外,我认为您可能需要更改输入存储库的名称,以使其与管道的名称更具区分性。Pachyderm规范化了存储库名称以满足Kubernetes命名要求,而mopng-beneficiary-v2mopng_beneficiary_v2可能会规范化为相同的存储库名称(您可能会收到像repo already exists这样的错误)。尝试将输入存储库重命名为mopng_beneficiary_input或类似的名称

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53987937

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档