首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >HiveContext vs spark sql

HiveContext vs spark sql
EN

Stack Overflow用户
提问于 2018-08-21 10:24:07
回答 1查看 2.5K关注 0票数 0

我正在尝试比较spark sql和hive上下文,我可以知道有什么不同吗? hivecontext sql使用hive查询,而spark sql使用spark查询吗?

下面是我的代码:

代码语言:javascript
复制
sc = pyspark.SparkContext(conf=conf).getOrCreate()
sqlContext = HiveContext(sc)
sqlContext.sql ('select * from table')

而sparksql:

代码语言:javascript
复制
spark.sql('select * from table')

我能知道这两个有什么区别吗?

EN

回答 1

Stack Overflow用户

发布于 2018-08-21 10:54:57

SparkSession提供了与底层Spark功能交互的单一入口点,并允许使用DataFrame和Dataset API对Spark进行编程。最重要的是,它限制了开发人员在与Spark交互时必须处理的概念和构造的数量。

SparkSession在没有显式创建SparkConf、SparkContext或SQLContext的情况下,将它们封装在自己内部。

SparkSession已经将SQLContext和HiveContext合并到来自SparkSession 2.0+的一个对象中。

在构建会话对象时,例如:

代码语言:javascript
复制
val spark = SparkSession .builder() .appName("SparkSessionExample").config( "spark.sql.warehouse.dir", warehouseLocation).enableHiveSupport().getOrCreate()

.enableHiveSupport()提供HiveContext函数。因此您将能够访问配置单元表,因为spark session是使用HiveSupport初始化的。

因此,"sqlContext.sql“和”spark.sql“之间没有区别,但建议使用"spark.sql",因为spark是所有Spark API的单一入口点。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51940744

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档