首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >培训失败- AWS机器学习

培训失败- AWS机器学习
EN

Stack Overflow用户
提问于 2021-01-08 11:24:36
回答 1查看 432关注 0票数 0

我正在使用MERN(Mongodb、Express、React、NodeJS)堆栈Code.But进行Aws机器学习。问题是,当我上传用于进程机器学习的数据文件(.csv文件)时,经过某些过程培训后,由于TrainingFailed错误而失败,如下所示:

AlgorithmError: CannotStartContainerError.请确保集装箱可以与“码头运行列车”一起运行。有关详细信息,请参阅SageMaker文档。Dockerfile的入口点可能没有正确定义,或者缺少权限。

我还在AWS帐户中设置了以下设置。

还在AWS帐户中授予以下权限:

我还将所有键应用到mongodb配置设置中,在所有设置和权限之后,我无法理解处理机器learning.Actually培训所需的内容,并且无法在s3 bucket.Its中获得模型工件,如下所示:

未启动sagemaker进程。有人能帮我吗?

我的Dockerfile,它存储在带有名称DockerFile的项目文件夹中。

代码语言:javascript
复制
FROM ubuntu
RUN apt-get update
RUN apt-get install curl -y
RUN curl -sL https://deb.nodesource.com/setup_10.x -o nodesource_setup.sh
RUN bash nodesource_setup.sh
RUN apt install nodejs -y
WORKDIR /usr/app
COPY . /usr/app/
RUN npm install
EXPOSE 3000
ENTRYPOINT [ "python3.7", "/opt/ml/code/train.py" ]

我还在Docker集线器中设置了代码图像,用于Sagemaker、线性学习者和xgboost,并在aws中的ECR中创建了存储库。

我还将train.py复制到aws中的opt/ml/code/tra.py目录中,并获得了输出输出:,但仍然有此错误。

EN

回答 1

Stack Overflow用户

发布于 2021-01-12 11:53:39

您所得到的错误意味着,sagemaker无法启动您的码头映像,这是因为您没有正确定义入口点。你可以看看我的存储库。基本上,在您的dockerfile中,您必须安装一些包,创建一个文件夹,比如/opt/ml/code,并将您的培训脚本放入这个文件夹中,这个脚本将被称为traintrain文件应该尊重您可以读取这里的一些指示。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65628085

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档