文章/答案/技术大牛

发布

社区首页 >问答首页 >创建群集需要mrjob InstanceProfile

问创建群集需要mrjob InstanceProfile
EN

Stack Overflow用户

提问于 2015-04-19 15:42:40

回答 1查看 593关注 0票数 0

我正在尝试使用python MRJob在亚马逊EC2上运行一个实例这里是一个简单的python脚本，用于在txt文件中查找最常用的单词

from mrjob.job import MRJob

class MRWordFrequencyCount(MRJob):
    def mapper(self, _, line):
        yield "chars", len(line)
        yield "words", len(line.split())
        yield "lines", 1

    def reducer(self, key, values):
        yield key, sum(values)


if __name__ == '__main__':
MRWordFrequencyCount.run()

这是我的mrjob.conf文件：

runners:
  emr:
    aws_access_key_id: XXXXXXXXXXXXXXXXXX
    aws_secret_access_key: XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
    aws_region: us-west-1
    ec2_key_pair: EMR
    ec2_key_pair_file: ~/EMR.pem   # ~/ and $ENV_VARS allowed here
    ssh_tunnel_to_job_tracker: true

当我运行脚本时：

python MRMostUsedWord.py -r emr romeo.txt > most_used_word.out

我得到以下错误：

<Error>
<Type>Sender</Type>
<Code>ValidationError</Code>
<Message>InstanceProfile is required for creating cluster</Message>
</Error>
<RequestId>4d1a1e3b-e665-11e4-b9e1-a557982e1081</RequestId>
</ErrorResponse>

你知道为什么我会收到这个错误吗？

我还使用以下命令创建实例配置文件：

aws emr create-default-roles

也许需要修改mrjob.conf文件？但我不知道该怎么做？

python

amazon-ec2

emr

mrjob

回答 1

Stack Overflow用户

发布于 2015-04-20 18:10:21

如果您使用AWS IAM配置AWS权限，您可以使用iam_job_flow_role MRJob选项为作业指定IAM配置文件。有关更多详细信息，请参阅iam_job_flow_role。在默认情况下，这将需要mrjob.conf中的以下行

iam-job-flow-role: EMRDefaultRole

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/29727165

复制

相似问题

问创建群集需要mrjob InstanceProfile
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问创建群集需要mrjob InstanceProfileEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问创建群集需要mrjob InstanceProfile
EN