我正在尝试重现来自this article的结果:我拥有所需的所有原始大数据,并且我已经创建了tweets表,但是由于某些原因,“更复杂的查询”会导致大量的MR作业,并以No data available结束。我使用的是蜂蜡和它的查询编辑器。
会有什么问题呢?
当在终端中运行时,查询结果为
MapReduce Jobs Launched:
Job 0: Map: 1 Reduce: 1 Cumulative CPU: 6.83 sec HDFS Read: 274 HDFS Write: 96 SUCCESS
Job 1: Map: 1 Reduce: 1 Cumulative CPU: 3.96 sec HDFS Read: 471 HDFS Write: 0 SUCCESS
Total MapReduce CPU Time Spent: 10 seconds 790 msec
OK
Time taken: 585.312 seconds,其中0个HDFS写入看起来可疑。
发布于 2014-07-16 15:43:58
对不起,每个人:事实证明,我应该在对表运行任何查询之前将数据加载到表中。
https://stackoverflow.com/questions/24737498
复制相似问题