我试着在amazon sagemaker studio上训练一个pytorch模型。
当我使用EC2进行训练时,它可以正常工作:
estimator = PyTorch(entry_point='train_script.py',
role=role,
sagemaker_session = sess,
train_instance_count=1,
train_instance_type='ml.c5.xlarge',
framework_version='1.4.0',
source_dir='.',
git_config=git_config,
)
estimator.fit({'stockdata': data_path})它是在经典的sagemaker笔记本(非studio)中的本地模式下的工作:
estimator = PyTorch(entry_point='train_script.py',
role=role,
train_instance_count=1,
train_instance_type='local',
framework_version='1.4.0',
source_dir='.',
git_config=git_config,
)
estimator.fit({'stockdata': data_path})但是当我在sagemaker studio上使用相同的代码(使用train_instance_type='local')时,它不能工作,并且我有以下错误:没有这样的文件或目录:'docker':'docker‘
我尝试使用pip install安装docker,但如果在终端中使用docker命令,则找不到该命令
发布于 2020-08-05 01:10:17
这表示查找Docker服务时出现问题。
默认情况下,Docker没有安装在Docker Studio (confirming github ticket response)中。
https://stackoverflow.com/questions/61520346
复制相似问题