首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Spark & HCatalog?

Spark & HCatalog?
EN

Stack Overflow用户
提问于 2014-08-14 21:03:47
回答 3查看 3.9K关注 0票数 3

我对使用Pig加载HCatalog感到很舒服,并且想知道是否有可能使用Spark来代替Pig。不幸的是,我对Spark还很陌生。

你能提供一些关于如何开始的材料吗?有没有什么Spark库可以使用?有什么例子吗?我把所有的练习都放在了http://spark.apache.org/上,但它们都集中在RDD上,不再深入了。

我将非常感谢任何帮助..。

问候

帕韦尔

EN

回答 3

Stack Overflow用户

发布于 2014-08-18 20:03:05

您可以参考下面的链接,了解如何将HCatalog InputFormat包装器与Spark一起使用;该链接是在SparkSQL之前编写的。

https://gist.github.com/granturing/7201912

票数 1
EN

Stack Overflow用户

发布于 2015-03-25 21:27:46

您可以使用spark SQL来读取Hive Table,而不是HCatalog。

https://spark.apache.org/sql/

您可以使用Spark Java/Scala/Python语言应用相同的转换,如Pig,如filter、join、group by。

票数 1
EN

Stack Overflow用户

发布于 2015-02-03 22:32:26

我们的系统已经加载了这两个,我们可以使用它们中的任何一个。Spark继承了你正在使用的语言的特点,Scala,Python……例如,结合使用Spark和Python,您可以在Spark中利用许多Python库。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25308731

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档