以下是在EMR上安装和运行hive的代码
args = ['s3://' + zone_name + '.elasticmapreduce/libs/hive/hive-script',
'--base-path', 's3://' + zone_name + '.elasticmapreduce/libs/hive/',
'--install-hive', '--hive-versions', '0.13.1']
args2 = ['s3://' + zone_name + '.elasticmapreduce/libs/hive/hive-script',
'--base-path', 's3://' + zone_name + '.elasticmapreduce/libs/hive/',
'--hive-versions', '0.13.1',
'--run-hive-script', '--args',
'-f', s3_url]
steps = []
for name, args in zip(('Setup Hive', 'Run Hive Script'), (args, args2)):
step = JarStep(name,
's3://us-east-1.elasticmapreduce/libs/script-runner/script-runner.jar',
step_args=args,
# action_on_failure="CANCEL_AND_WAIT"
)
# should be inside loop
steps.append(step)现在,当我把这个提供给run_jobflow时,出于某种原因
我得到了错误
Error fetching jar file. java.lang.RuntimeException: Error whilst fetching 's3://us-east-1.elasticmapreduce/libs/script-runner/script-runner.jar
我可以使用我的凭据访问bucket elasticmapreduce/libs/script-runner/。我该如何解决这个问题?或者有没有其他方法可以提供script-runner
发布于 2019-11-12 22:18:46
这是因为您的集群位于不同的区域,而不是您从中获取jar的存储桶中。确保电子病历集群与您作为"zone_name“传递的区域相同。
https://stackoverflow.com/questions/44662408
复制相似问题