我正在尝试使用python- sagemaker -sdk,估计器类在amazon sagemaker上运行培训作业。
我有以下几点
estimator = PyTorch(entry_point='training_scripts/train_MSCOCO.py',
source_dir='./',
role=#dummy_role,
train_instance_type='ml.p3.2xlarge',
train_instance_count=1,
framework_version='1.0.0',
output_path=#dummy_output_path,
hyperparameters={'lr': 0.001,
'batch_size': 32,
'num_workers': 4,
'description': description})为保护隐私而隐藏的角色和output_path。
我得到以下错误,“没有名为training_scripts\train_MSCOCO的模块”。
当我运行python -m training_scripts.train_MSCOCO时,脚本运行得很好。但是,当我传递entry_point='training_script.train_MSCOCO.py时,它不会运行为“在目录中找不到名为"training_scripts.train_MSCOCO.py”的文件"./"“。
我对如何从AWS sagemaker中我的存储库的顶级运行嵌套训练脚本感到困惑,因为它们似乎具有相互冲突的路径需求,一个使用python模块点表示法,另一个使用标准文件路径斜杠表示法。
发布于 2019-07-25 01:38:45
这两种方法中的任何一种都有效:
estimator = PyTorch(entry_point='training_scripts/train_MSCOCO.py',
role=#dummy_role,
...
estimator = PyTorch(entry_point='train_MSCOCO.py',
source_dir='training_scripts',
role=#dummy_role,
...https://stackoverflow.com/questions/57187148
复制相似问题