搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏about云
让你真正理解什么是SparkContext, SQLContext 和HiveContext
2.SQLContext 和HiveContext的区别是什么？ 3.SQLContext、HiveContext与SparkContext的区别是什么？ SparkSQL 有SQLContext 和HiveContext.HiveContext 继承SQLContext.Hortonworks 和 Spark社区建议使用HiveContext.你可以看到下面，当你运行spark-shell,它和driver应用程序是交互的，他会自动创建SparkContext 定义为sc和HiveContext 定义为sqlContext.HiveContext 允许执行你可以看下 Spark 1.3.1 文档，SQLContext 和HiveContext 在SQLContext documentation and HiveContext documentation（
3.4K90发布于 2018-03-27
来自专栏java编程那点事
Hive数据源实战
操作Hive中的数据时，必须创建HiveContext，而不是SQLContext。将hive-site.xml拷贝到spark/conf目录下，将mysql connector拷贝到spark/lib目录下 HiveContext sqlContext = new HiveContext ，注意，这里，它接收的是SparkContext作为参数，不是JavaSparkContext HiveContext hiveContext = new HiveContext(sc.sc()); // 第一个功能，使用HiveContext的sql()方法，可以执行Hive中能够执行的HiveQL语句 // 判断是否存在student_infos表，如果存在则删除 hiveContext.sql = new HiveContext(sc); hiveContext.sql("DROP TABLE IF EXISTS student_infos"); hiveContext.sql("CREATE
98920编辑于 2023-02-25
来自专栏LhWorld哥陪你聊算法
【Spark篇】---SparkSQL on Hive的配置和使用
val hc = new HiveContext(sc) hc.sql("show databases").show hc.sql("user default").show hc.sql("select 是SQLContext的子类，连接Hive建议使用HiveContext。 HiveContext hiveContext = new HiveContext(sc); hiveContext.sql("USE spark"); hiveContext.sql("DROP TABLE (name STRING,age INT) row format delimited fields terminated by '\t' "); hiveContext.sql("load data */ val hiveContext = new HiveContext(sc) hiveContext.sql("use spark") hiveContext.sql("drop table
4.9K12发布于 2018-09-13
来自专栏大数据智能实战
DataFrame registerTempTable(注册临时表)后Table Not Found问题的解决
经过查资料，才发现由于自己的dataframe是用SQLContext创建的，而用HiveContext是无法访问的。这就涉及到registerTempTable生命周期的问题，以前都没细看，其生命周期只在所定义的sqlContext或hiveContext实例之中。换而言之，在一个sqlontext（或hiveContext）中registerTempTable的表不能在另一个sqlContext（或hiveContext）中使用。因此，HiveContext来创建DataFrame就没有问题。成功解决。
73720编辑于 2022-05-07
来自专栏about云
Spark Sql系统入门4：spark应用程序中使用spark sql
使用HiveContext，我们构建SchemaRDDs.这代表我们机构化数据，和操作他们使用sql或则正常的rdd操作如map（）. import org.apache.spark.sql.SQLContext Scala用户注意，我们不使用 import HiveContext. 相反，一旦我们有了结构化HiveContext实例化，我们可以导入 implicits 在例子2中。导入Java和Python在例子3和4中。 hiveCtx = HiveContext(sc) 现在我们有了HiveContext 或则SQLContext，我们准备加载数据和查询。基本查询例子为了对一个表查询，我们调用HiveContext或则SQLContext的sql()函数.第一个事情，我们需要告诉spark sql关于一些数据的查询。
1.8K70发布于 2018-03-26
来自专栏LhWorld哥陪你聊算法
【Spark篇】---SparkSQL中自定义UDF和UDAF，开窗函数的应用
三、开窗函数 row_number() 开窗函数是按照某个字段分组，然后取另一字段的前几个的值，相当于分组取topN 如果SQL语句里面使用到了开窗函数，那么这个SQL语句必须使用HiveContext 来执行，HiveContext默认情况下在本地无法创建。来执行，HiveContext默认情况下在本地无法创建 * @author root * */ public class RowNumberWindowFun { public static hiveContext = new HiveContext(sc); hiveContext.sql("use spark"); hiveContext.sql("drop = new HiveContext(sc) hiveContext.sql("use spark"); hiveContext.sql("drop table if exists sales");
2.3K20发布于 2018-09-13
来自专栏扎心了老铁
spark三种连接join
implements Serializable { private transient JavaSparkContext javaSparkContext; private transient HiveContext hiveContext; /* * 初始化Load * 创建sparkContext, sqlContext, hiveContext * */ public "yarn-client"); javaSparkContext = new JavaSparkContext(sparkConf); } /* * 创建hiveContext * 用于读取Hive中的数据 * */ private void initHiveContext() { hiveContext = new HiveContext * */ String query1 = "select * from gulfstream_test.orders"; DataFrame rows1 = hiveContext.sql
1.6K80发布于 2018-03-05
来自专栏大数据成神之路
Spark将Dataframe数据写入Hive分区表的方案
向hive数据仓库写入数据必须指定数据库，hive数据表建立可以在hive上建立，或者使用hiveContext.sql("create table .....") = new org.apache.spark.sql.hive.HiveContext(sc) import hiveContext.implicits._ hiveContext.sql("use 2、将DataFrame数据写入hive指定数据表的分区中 hive数据表建立可以在hive上建立，或者使用hiveContext.sql("create table....") ,使用saveAsTable时数据存储格式有限，默认格式为parquet，将数据写入分区的思路是：首先将DataFrame数据写入临时表，之后由hiveContext.sql语句将数据写入hive分区表中 = new org.apache.spark.sql.hive.HiveContext(sc) import hiveContext.implicits._ hiveContext.sql("use
17.6K30发布于 2019-07-23
来自专栏扎心了老铁
java使用spark/spark-sql处理schema数据
getHiveContext() throws SparkInitException { return new HiveContext(javaSparkContext); } class FiremanDriver implements Serializable { private String db; private String table; private HiveContext hiveContext;public FiremanDriver(String db, String table) { try { this.db = db; this.table = table; SparkClient sparkClient = new SparkClient(); hiveContext %s", db ,table); System.out.println(query); DataFrame rows = hiveContext.sql(
1.3K50发布于 2018-03-05
来自专栏码字搬砖
Spark Insert Hbase解决task not to serializable
import org.apache.spark.sql.DataFrame; import org.apache.spark.sql.Row; import org.apache.spark.sql.hive.HiveContext ).setAppName("SparkInsertHbase"); JavaSparkContext sc = new JavaSparkContext(conf); HiveContext hiveContext = new HiveContext(sc.sc()); DataFrame df = hiveContext.sql("select id,name from
1.2K10发布于 2018-10-24
来自专栏爱编码
《SparkSql使用教程》--- 大数据系列
一、SQLContext、HiveContext、SparkSession SQLContext：是spark sql的一个分支入口，可以用来操作sql，这个主要是针对spark来说 HiveContext \ /root/lib/sqlspark-1.0.jar \ /root/app/spark-2.3.0/examples/src/main/resources/people.json 三、HiveContext spark-hive_2.11</artifactId> <version>${spark.version}</version> </dependency> 2、建一个Scala应用程序 /** * hiveContext sqlConf.setAppName("SQLContextApp").setMaster("local[2]") val sc = new SparkContext(sqlConf) val hiveContext = new HiveContext(sc) //2)相关处理：json hiveContext.table("emp").show() //3)关闭资源 sc.stop(
1.2K20发布于 2019-07-03
来自专栏个人分享
SparkSQL的解析详解
SparkSQL有两个分支，sqlContext和hiveContext。 sqlContext现在只支持SQL语法解析器（Catalyst)，hiveContext支持SQL语法和HiveContext语法解析器。　　然而并没有什么卵用，catalyst解析做的有些简陋，很多不支持，所以在写程序的时候，还是声明的hiveContext对象。　　 hiveContext的解析过程: 　　(1)SQL语句经过HiveQl.parseSql解析成了Unresolved LogicalPlan。　
95920发布于 2018-09-06
来自专栏小鹏的专栏
spark学习笔记：spark sql
{SparkConf, SparkContext} import org.apache.spark.sql.SparkSession import org.apache.spark.sql.hive.HiveContext SparkConf( ).setAppName( "TestSpark Pipeline" ) val sparkContext = new SparkContext( conf ) val hiveContext = new HiveContext(sparkContext) val sqlContext = new SQLContext(sparkContext) val spark = SparkSession.builder val sqlQuery = Source.fromFile( dataSqlFile ).mkString val dataSqlFrame = SparkConfTrait.hiveContext.sql
1K10发布于 2019-09-19
来自专栏java编程那点事
Spark SQL发展史
SQLContext 要使用Spark SQL，首先就得创建一个创建一个SQLContext对象，或者是它的子类的对象，比如HiveContext的对象。 ——HiveContext。 HiveContext的功能除了包含SQLContext提供的所有功能之外，还包括了额外的专门针对Hive的一些功能。要使用HiveContext，就必须预先安装好Hive，SQLContext支持的数据源，HiveContext也同样支持——而不只是支持Hive。对于HiveContext，它默认的方言是“hiveql”
89320编辑于 2023-02-25
来自专栏扎心了老铁
使用spark对hive表中的多列数据判重
public SQLContext getSQLContext() { return new SQLContext(javaSparkContext); } public HiveContext getHiveContext() { return new HiveContext(javaSparkContext); } private void initSparkConf import org.apache.spark.sql.DataFrame; import org.apache.spark.sql.Row; import org.apache.spark.sql.hive.HiveContext hiveContext; private String db; private String tb; private String pt; private String %s where %s", db ,tb, partition); System.out.println(query); DataFrame rows = hiveContext.sql
8.8K30发布于 2018-03-05
来自专栏王小雷
Spark学习之Spark SQL（8）
在应用使用Spark 5.1 初始化Spark //Sacla中SQL的import的声明 import org.apache.spark.sql.hive.HiveContext //创建HiveContext import hiveCtx. val hiveCtx = new HiveContext(sc) 5.2 基本的查询示例 val input = hiveCtx.jsonFile(inputFile)
1.5K70发布于 2018-01-02
来自专栏YoungGy
SparkSQL入门_1
DataFrame HiveContext是SQLContext的超集，一般需要实例化它，也就是 from pyspark.sql import HiveContext sqlContext = HiveContext teenNames.collect(): print(teenName) # hive的操作 # sc is an existing SparkContext. from pyspark.sql import HiveContext sqlContext = HiveContext(sc) sqlContext.sql("CREATE TABLE IF NOT EXISTS src (key INT, value STRING)
1.2K110发布于 2018-01-02
来自专栏JavaEdge
Spark SQL实战(04)-API编程之DataFrame
、JDBC等等，而HiveContext除了支持SQLContext的数据源外，还支持Hive的数据源。而HiveContext可以在内存中创建表和视图，并将其存储在Hive Metastore中。 SQL语言支持：SQLContext和HiveContext都支持Spark SQL中的基本语法，例如SELECT、FROM、WHERE等等。但HiveContext还支持Hive中的所有SQL语法，例如INSERT、CREATE TABLE AS等等。如若访问Hive中数据或在内存中创建表和视图，推荐HiveContext；若只需访问常见数据源，使用SQLContext。
5.5K20编辑于 2023-03-25
来自专栏DT乱“码”
csv导入Hive脚本
from pyspark.sql import HiveContext hivec = HiveContext(sc) # 创建一个hivecontext对象用于写执行SQL，sc为sparkcontext
2.3K10发布于 2019-05-26
来自专栏SmartSi
Spark 在Spark2.0中如何使用SparkSession
SparkSessionZipsExample，该应用程序从 JSON 文件读取邮政编码，并使用 DataFrame API 执行一些分析，然后运行 Spark SQL 查询，而无需访问 SparkContext，SQLContext 或 HiveContext 1.7 使用SparkSession保存和读取Hive表接下来，我们将创建一个 Hive 表，并使用 SparkSession 对象对其进行查询，就像使用 HiveContext 一样。通过 SparkContext，Driver 可以访问其他上下文，如SQLContext，HiveContext和 StreamingContext 来编程Spark。以前通过 SparkContext，SQLContext 或 HiveContext 在早期版本的 Spark 中提供的所有功能现在均可通过 SparkSession 获得。
5.5K61发布于 2019-08-08

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页

点击加载更多

让你真正理解什么是SparkContext, SQLContext 和HiveContext

Hive数据源实战

【Spark篇】---SparkSQL on Hive的配置和使用

DataFrame registerTempTable(注册临时表)后Table Not Found问题的解决

Spark Sql系统入门4：spark应用程序中使用spark sql

【Spark篇】---SparkSQL中自定义UDF和UDAF，开窗函数的应用

spark三种连接join

Spark将Dataframe数据写入Hive分区表的方案

java使用spark/spark-sql处理schema数据

Spark Insert Hbase解决task not to serializable

《SparkSql使用教程》--- 大数据系列

SparkSQL的解析详解

spark学习笔记：spark sql

Spark SQL发展史

使用spark对hive表中的多列数据判重

Spark学习之Spark SQL（8）

SparkSQL入门_1

Spark SQL实战(04)-API编程之DataFrame

csv导入Hive脚本

Spark 在Spark2.0中如何使用SparkSession

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐