腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(290)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
mrjob
文档中的“由
MRJOB
_CONF指定的位置”
在
mrjob
文档中,哪个路径是“
MRJOB
_CONF指定的位置”?链接到
mrjob
文档:
浏览 2
修改于2017-12-10
得票数 0
1
回答
MRJob
-迭代值
我已经用集合解决了这个问题: from
mrjob
.job import
MRJob
def mapper(self, _, line):所以我试着搜索例子,但我找不到很多例子,那些没有
MRJob
的例子是用一些变量来保存子问题的状态,并迭代子问题的值(在这个问题中是爱丽丝和鲍勃)来连接它们,但我不知道如何在
MRJob
中使用这种方式。
浏览 27
提问于2020-11-29
得票数 0
2
回答
利用多核LocalMRJobRunner实现
MRJob
我正在使用python /
mrjob
框架来执行mapreduce作业。只有大约4G的数据,我不想经历设置Hadoop或EMR的麻烦。我有一个64核心机器,它需要大约两个小时来处理数据与
mrjob
。我注意到
mrjob
为我的工作分配了54个映射器,但似乎一次只运行一个。是否有一种方法可以让
mrjob
与我的所有cpu内核并行运行所有任务? 我手动更改了任务的数量,但没有起到多大作用。
浏览 3
修改于2015-07-11
得票数 3
回答已采纳
2
回答
使用MapReduce的
MRjob
生成前10个值的
MRjob
作业
from
mrjob
.job import
MRJob
from heapq import nlargest return [ MRStep(mapper = self.mapper_get_ratings,
浏览 4
提问于2016-11-29
得票数 3
1
回答
如何在EMR上运行
mrjob
我将
mrjob
.conf、readme.txt和word_count.py文件上传到了~/hello_mapreduce文件夹中的EC2实例中,并尝试运行以下命令: mr_job.execute() File "/usr/local/lib/python2.7/dist-packages/
mrjob
//
mrjob
浏览 3
提问于2014-08-09
得票数 1
回答已采纳
1
回答
TotalOrderPartitioner和
mrjob
在使用
mrjob
时,如何指定TotalOrderPartitioner?这是默认的,还是必须显式指定?我在不同的数据集上看到了不一致的行为。
浏览 0
提问于2016-02-26
得票数 1
回答已采纳
1
回答
此
MRJob
示例的说明
from
mrjob
.job import job def
浏览 0
修改于2015-10-20
得票数 0
1
回答
创建群集需要
mrjob
InstanceProfile
我正在尝试使用python
MRJob
在亚马逊EC2上运行一个实例这里是一个简单的python脚本,用于在txt文件中查找最常用的单词 def mapper(self, _, line): yield key, sum(values) if __name__ ==
浏览 1
提问于2015-04-19
得票数 0
1
回答
MRjob
: ImportError:无法导入名称python
在树冠编辑器中,当执行"from
mrjob
.job import
MRjob
“时,我得到"ImportError: cannot import name
MRjob
”,不确定这里有什么问题。
浏览 0
修改于2017-09-27
得票数 0
1
回答
在AWS上运行
MRJOB
时出错
我将
mrjob
.conf文件放在/home目录中,并试图通过命令运行作业,我得到了以下错误: 文件"/Users/bimalthapa/anaconda/lib/python2.7/site-packages/
mrjob
-0.4.6- py2.7.EGG/
mrjob
/conf.py. or“,第283行,在conf_object_at_path with (Conf_path)中作为f: IOError:Errno 2没有这样的文
浏览 1
修改于2017-09-22
得票数 0
回答已采纳
1
回答
Python中的
MRJob
排序
以下是我的代码:from
mrjob
.job import
MRJob
TotalAmountCust.run()from
mrjob
.jobimport
MRJob
from
mrjob
.step
浏览 11
提问于2018-01-30
得票数 1
1
回答
无法在本地运行python
MRJob
如果我理解正确的话,您可以通过运行
MRJob
来模拟
MRJob
的多进程运行我正在运行windows(目前没有选择),当我发出上面的命令时C:\Users\someuser\Documents\Python_projects\something>python
MRJob
_parser.py -r locno configs.writing wrapper script to c:\users
浏览 2
提问于2015-07-02
得票数 3
2
回答
Python编程
mrjob
包权限错误
我想运行一个map reduce程序,所以我根据需要安装了
mrjob
包。现在,当我尝试运行给定的示例程序时: def mapper(self,
浏览 0
修改于2018-03-13
得票数 1
1
回答
Python
mrjob
-查找10个最长的单词,但
mrjob
返回重复的单词
我正在使用Python
mrjob
从一个文本文件中查找10个最长的单词。我已经得到了一个结果,但是结果包含重复的单词。如何仅获取唯一的单词(即删除重复的单词)?%%file most_chars.py from
mrjob
.step import MRStep WORD_RE =re.compile(r"[\w']+") # any whitespace or apostrophe, used to split
浏览 41
修改于2021-10-28
得票数 1
回答已采纳
2
回答
从
MRJob
笔记本运行IPython
我试着从IPython笔记本上运行
mrjob
示例 并得到错误:有办法从IPython笔记本上运行
mrjob
浏览 8
修改于2014-07-11
得票数 5
1
回答
访问
MRjob
的hdfs的流输出
我正在尝试使用Python驱动程序来运行一个迭代的
MRjob
程序。退出条件取决于计数器。 395 if chunk == b'': /home/myname/.conda/envs/py27&
浏览 0
修改于2018-04-05
得票数 31
1
回答
使用
mrjob
subprocess.CalledProcessError的Python作业
我正试图在我的自定义数据上从
mrjob
的网站上运行基本示例。我已经使用流成功地运行了Hadoop映射还原,我也成功地尝试了没有Hadoop的脚本,但是现在我尝试通过
mrjob
命令在Hadoop上运行它。 super(
MRJob
浏览 2
修改于2014-08-25
得票数 2
回答已采纳
1
回答
如何在
MRJob
中遍历各行
我使用Python和
MRJob
通过以下代码完成此操作:import re fields = line.split(";") epochtemp = int(fields
浏览 3
修改于2018-10-17
得票数 0
2
回答
运行python
mrjob
字数统计示例时出错
MRJob
from
mrjob
.launch import MRJobLauncher
浏览 2
修改于2017-09-27
得票数 0
回答已采纳
1
回答
在
MRJob
中连接配置单元
我们的想法是使用
MRJob
处理输入文件,并使用HIVE从hadoop集群获取数据。我想知道是否可以在
MRJob
模块内连接HIVE。如果是这样的话,该怎么做呢?我是Hadoop、
MRJob
和Hive的新手。 请提供一些建议。
浏览 0
提问于2016-11-29
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券