首先,我需要承认我是布卢米克斯和火花的新手。我只想试一试布卢米克斯星火服务公司。
我想对一个文本文件中的10亿条记录执行批处理操作,然后使用我自己的一组Java来处理这些记录。
这就是我想要使用星火服务的地方,以便更快地处理数据集。
以下是我的问题:
我将感谢任何和所有的帮助,以我的方式,就上述查询。
期待着这里的一些专家的建议。
谢谢。
发布于 2015-10-29 04:51:12
服务现在已经可用,它允许您为python/scala提交带有Spark submit的java代码/批处理程序以及笔记本接口。
之前,测试版代码仅限于笔记本交互界面。
问候阿努普
https://stackoverflow.com/questions/32940788
复制相似问题