首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >创建群集需要mrjob InstanceProfile

创建群集需要mrjob InstanceProfile
EN

Stack Overflow用户
提问于 2015-04-19 15:42:40
回答 1查看 593关注 0票数 0

我正在尝试使用python MRJob在亚马逊EC2上运行一个实例这里是一个简单的python脚本,用于在txt文件中查找最常用的单词

代码语言:javascript
复制
from mrjob.job import MRJob

class MRWordFrequencyCount(MRJob):
    def mapper(self, _, line):
        yield "chars", len(line)
        yield "words", len(line.split())
        yield "lines", 1

    def reducer(self, key, values):
        yield key, sum(values)


if __name__ == '__main__':
MRWordFrequencyCount.run()

这是我的mrjob.conf文件:

代码语言:javascript
复制
runners:
  emr:
    aws_access_key_id: XXXXXXXXXXXXXXXXXX
    aws_secret_access_key: XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
    aws_region: us-west-1
    ec2_key_pair: EMR
    ec2_key_pair_file: ~/EMR.pem   # ~/ and $ENV_VARS allowed here
    ssh_tunnel_to_job_tracker: true

当我运行脚本时:

代码语言:javascript
复制
python MRMostUsedWord.py -r emr romeo.txt > most_used_word.out

我得到以下错误:

代码语言:javascript
复制
<Error>
<Type>Sender</Type>
<Code>ValidationError</Code>
<Message>InstanceProfile is required for creating cluster</Message>
</Error>
<RequestId>4d1a1e3b-e665-11e4-b9e1-a557982e1081</RequestId>
</ErrorResponse>

你知道为什么我会收到这个错误吗?

我还使用以下命令创建实例配置文件:

代码语言:javascript
复制
aws emr create-default-roles

也许需要修改mrjob.conf文件?但我不知道该怎么做?

EN

回答 1

Stack Overflow用户

发布于 2015-04-20 18:10:21

如果您使用AWS IAM配置AWS权限,您可以使用iam_job_flow_role MRJob选项为作业指定IAM配置文件。有关更多详细信息,请参阅iam_job_flow_role。在默认情况下,这将需要mrjob.conf中的以下行

代码语言:javascript
复制
iam-job-flow-role: EMRDefaultRole
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/29727165

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档