一.前述 Hive中搭建分为三中方式 a)内嵌Derby方式 b)Local方式 c)Remote方式 三种方式归根到底就是元数据的存储位置不一样。 这种存储方式的弊端是在同一个目录下同时只能有一个hive客户端能使用数据库。 > <configuration> <property> <name>hive.metastore.warehouse.dir</name> <value>/user/hive_remote > <configuration> <property> <name>hive.metastore.warehouse.dir</name> <value>/user/hive dev/null & 客户端直接使用hive命令即可!!!
下载安装mysql 下载并安装MySQL官方的 Yum Repository wget -i -c http://dev.mysql.com/get/mysql57-community-release-el7- yum -y install mysql57-community-release-el7-10.noarch.rpm` 下面就是使用yum安装MySQL了 yum -y install mysql-community-server 创建一个账号:用户名为hive,密码为hive 或者 mysql> create user 'hive'@'%' identified by 'hive'; //创建一个账号:用户名为hive,密码为hive =/opt/hive-2.3.4 PATH=$PATH:$HIVE_HOME/bin export PATH HIVE_HOME 配置hive配置文件 编辑hive-env.xml文件 /hive –service metastore # 此时在hive的bin目录 启动hive 输入hive即可 # 您将看到如下信息 [root@hservice opt]# hive SLF4J:
1.下载Hive#下载wget https://dlcdn.apache.org/hive/hive-3.1.3/apache-hive-3.1.3-bin.tar.gz# 解压tar -zxvf apache-hive =$PATH:$HIVE_HOME/bin3.修改配置信息1.修改 hive-env.shcp hive-env.sh.template hive-env.shvim hive-env.shHADOOP_HOME =export HIVE_CONF_DIR=/home/hadoop/bigdata/hive/conf2.修改 hive-sitz.xml<? -dbType mysql mysql创建用户CREATE USER 'hive'@'%' IDENTIFIED BY 'hive';grant all privileges on hive.* to ${HIVE_HOME}/logs/hiveserver2.log 2>&1 &7.登录hive# 正常方式hive # 使用hiveserver2(在启动服务后需要一两分钟后才能登录)beeline
,slave2(hive客户端) hive建立在hadoop的HDFS上,搭建hive前,先需搭建hadoop 远程模式: 101.201.81.34(Mysql server meta server安装位置 ) 一、101.201.81.43 该主机上安装好mysql,并且建立一个hive数据库 (要开启远程访问) 二、在master上安装hive 1.安装hive 1)在apache官网上下载hive-2.1.0 -R 775 /home/cms/hive 5)sudo chown -R cms /home/cms/hive 2.修改/etc/profile加入HIVE_HOME的变量 HIVE_HOME/PATH /CLASSPATH 我粘贴的是我所有的配置 export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64 export HADOOP_HOME=$HOME/hadoop /lib目录下 可以从Mysql的官方网站下载,但是记得一定要解压呀,下载的是一个tar.gz文件,解压后为jar文件 7.hive表存储在在HDFS中的/user/hive/warehouse中 三、
Hive的DDL操作 Hive是一种数据库技术,可以定义数据库和表来分析结构化数据。主题结构化数据分析是以表方式存储数据,并通过查询来分析。 创建了数据库之后,在HDFS上的存储路径默认为/usr/hive/warehouse/*.db具体语法为: hive> create database|schema [if not exists] database_name 默认地址是/user/hive/warehouse/db_name.db/table_name/partition_name/… 0: jdbc:hive2://localhost:10000/default 设置方法:hive.exec.dynamic.partition.mode=strict/nonstrict 0: jdbc:hive2://localhost:10000/default> set 表的多种导入数据方式 从本地系统上导入数据(假设有数据worker.txt) 先在hive中创建表 将本地的数据导入 -- hive中创建表 hive> create table user #
环境 操作系统: Windows 7 JDK版本: 1.8.0_221 Hadoop版本: 2.6.0 (Hive依赖) Hive版本: 1.2.2 2. 前期准备 3.1 安装并启动完成HADOOP 详见: Windows搭建HDFS 2.6.0(附加搭建Hadoop) 4. 安装部署 4.1. 解压 4.2 执行安装hive . \bin\hive 排坑: 'hive' 不是内部或外部命令,也不是可运行的程序或批处理文件。 解决办法: 下载 hive.cmd(提取码6666) 放在 %HIVE_HOME%\bin 下 报错信息如下: E:\soft_work\apache-hive-1.2.2-bin\bin>hive /hive-log4j.properties hive> 5.
解压 hive 安装包 sudo tar -zxvf apache-hive-2.1.1-bin.tar.gz 2. on *.* to 'root'@'%' identified by 'newPassword' with grant option; # 刷新权限 mysql> flush privileges; 7. 配置 Hive 环境变量 export HIVE_HOME=/opt/apache-hive-2.1.1-bin # 在下面这行末尾添加 :$HIVE_HOME/bin export PATH=$HOME 配置 /opt/apache-hive-2.1.1-bin/conf/hive-site.xml hive.metastore.uris中的 bigdata 含义为 metastore 所在的机器 /metastore.log 2>&1 & # 启动 hive server nohup hive --service hiveserver2 >> /opt/apache-hive-2.1.1-bin
本次博主为大家带来的事Hive常见的属性配置。希望能够帮助大家。 一. Hive数据仓库位置配置 1. [bigdata@hadoop001 hive]$ vim /opt/module/hive/conf/hive-site.xml // 复制下面的文档 <property> <name>hive.cli.print.header Hive运行日志信息配置 1.Hive的log默认存放在/tmp/atguigu/hive.log目录下(当前用户名下) 2.修改hive的log存放日志到/opt/module/hive/logs 在hive-log4j.properties文件中修改log存放位置 hive.log.dir=/opt/module/hive/logs ? 3. 例如: [bigdata@hadoop001 hive]$ bin/hive -hiveconf mapred.reduce.tasks=10; 注意:仅对本次hive启动有效 查看参数设置: hive
1、搭建伪分布式的Hadoop 从hadoop下载Hadoop-2.7 etc/hadoop/,修改core-site.xml List-1.1 <configuration> <property> 2、安装Hive-2.1.1 从官网下载Hive-2.1.1 在conf下,"cp hive-default.xml.template hive-site.xml" 之后修改hive-site.xml 命令行执行hive命令,就进入Hive CLI了,之后可以执行创建表等操作。 3、Hive on park 因为Hive的计算引擎默认是map reduce,比较慢,我们想要将Hive的计算引擎设置为Spark。 这是最坑的部分。 命令行执行hive,进入hive CLI,执行命令"set hive.execution.engine;"可以看到当前正在使用的计算引擎。
Hive On LLAP搭建&常见问题 基本概述 Hive在2.0之后,推出一个新特性LLAP(Live Long And Process),可以显著提高查询效率。 环境搭建 首先编辑hive-site.xml,配置LLAP,这里hive.llap.daemon.service.hosts配置为运行在yarn上的LLAP服务名,这里可以自定义设置,但要与下一步中使用 hive命令生成的LLAP环境包中的服务名一致。 > <name>hive.llap.execution.mode</name> <value>all</value> </property> <property> <name>hive.llap.daemon.service.hosts 后话 至此,LLAP已经搭建完成,如果有帮助的,记得点赞、关注。
用户界面,Hive支持是Hive的Web UI,Hive命令行,HiveHD洞察(在Windows服务器)。 Hive工作原理 下图描述了Hive 和Hadoop之间的工作流程。 ? 下表定义Hive和Hadoop框架的交互方式: Step No. 7 Execute Job在内部,执行作业的过程是一个MapReduce工作。执行引擎发送作业给JobTracker,在名称节点并把它分配作业到TaskTracker,这是在数据节点。 Hadoop集群的搭建前面已经介绍了,链接如下: https://www.cnblogs.com/xiao987334176/p/13208915.html 由于使用的是jdk1.7,我需要升级到jdk1.8 shell测试 # /usr/local/hive/bin/hive hive> CREATE SCHEMA testdb; OK Time taken: 2.052 seconds hive> SHOW
| | MySQL | 5.7.17 | | Kylin | 1.6.0 | 以上全部运行、大概至少需要2GB内存 一、搭建 <name>dfs.replication</name> <value>1</value> </property> </configuration> 二、搭建 hive-default.xml cp hive-log4j2.properties.template hive-log4j2.properties 然后,需要初始化一下 hive的数据库表 schematool -dbType mysql -initSchema 三、搭建Hbase环境 安装Hbase(1.3.0) http://hbase.apache.org/ 下载地址 hbase.tmp.dir</name> <value>/home/lpe234/hbase-tmp</value> </property> </configuration> 四、搭建
基于Docker搭建大数据集群(六)Hive搭建 前言 之前搭建的都是1.x版本,这次搭建的是hive3.1.2版本的。。 还是有一点细节不一样的 Hive现在解析引擎可以选择spark,我是用spark做解析引擎的,存储还是用的HDFS 我是在docker里面搭建的集群,所以都是基于docker操作的 一、安装包准备 ~ 2.12.9 三、环境准备 (1)解压hive压缩包 tar xivf apache-hive-3.1.2-bin -C /opt/hive/ (2)新建一个日志目录 mdkir /opt/hive 将hive的jline包替换到hadoop的yarn下 mv /opt/hive/apache-hive-3.1.2-bin/lib/jline-2.12.jar /opt/hadoop/hadoop /hive --service metastore & client节点 hive
; USE hive; CREATE USER 'hive'@'localhost' IDENTIFIED BY 'hive'; GRANT ALL ON hive.* TO 'hive'@'localhost ' IDENTIFIED BY 'hive'; GRANT ALL ON hive.* TO 'hive'@'%' IDENTIFIED BY 'hive'; FLUSH PRIVILEGES; 安装hadoop wget http://mirrors.shu.edu.cn/apache/hive/hive-2.3.4/apache-hive-2.3.4-bin.tar.gz tar -xzvf apache-hive /hive" export path="/home/user_name/hive/bin:$PATH" 配置文件 cd hive/conf cp hive-default.xml.template hive-site.xml # 复制hive/conf/hive-site.xml到spark/conf下 cp hive/conf/hive-site.xml sprak/conf # 复制mysql-connector-java.jar
1.Hive简介 hive是基于Hadoop的一个数据仓库的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。 2.环境Hive安装 1.前置环境 对应的安装包可以再公众号我获取。在安装Hive之前,需要先确保Hadoop与MySQL是正常启动的,Hadoop与MySQL的搭建可以参[环境搭建的系列文章。 C /app #修改别名 mv apache-hive-3.1.2-bin hive-3.1.2 3.添加环境变量 vim /etc/profile #添加下面两行 export HIVE_HOME= /app/hive-3.1.2 export PATH=$PATH:$HIVE_HOME/bin #source /etc/profile 4.解决日志的Jar包冲突 cd /app/hive-3.1.2 > <value>truevalue> property> configuration> 7.登录MySQL创建对应数据库 create database metastore;
离线数据分析平台实战——110Hive介绍和Hive环境搭建 Hive介绍 Hive是构建在Hadoop之上的数据仓库平台,设计目标就是将hadoop上的数据操作同SQL结合,让熟悉SQL编程的开发人员能够轻松的向 Hive安装--Hive安装 安装步骤: 下载hive,下载地址:http://archive.cloudera.com/cdh5/cdh/5/hive-0.13.1-cdh5.3.6.tar.gz Hive Web界面安装 Hive提供了一个Web的操作客户端,一般我们通过该页面查看hive的信息,配置信息包括: hive.hwi.listen.host指定监听ip(默认0.0.0.0), hive.hwi.listen.port 配置超级用户名和密码, mysqladmin -u root password 123456 6. root用户登录mysql -u root -p 123456 7. 启动metastore服务(启动hdfs+yarn服务) hive --service metastore & 7. 进入hive的客户端 hive <?
win10安装Hadoop3.0.0:https://blog.csdn.net/qq262593421/article/details/105927625 win10搭建hive3.0.0:https /dist/hive/hive-3.0.0/ 下载文件:apache-hive-3.0.0-bin.tar 二、配置环境变量 1、解压安装包到:D:\Hadoop\Hive\apache-hive 3、配置hive环境变量 变量名:HIVE_HOME 变量值:D:\Hadoop\Hive\apache-hive-3.0.0-bin 变量名:HIVE_CONF_DIR 变量值:D:\Hadoop \Hive\apache-hive-3.0.0-bin\conf # hive的lib库目录 export HIVE_AUX_JARS_PATH=D:\Hadoop\Hive\apache-hive-3.0.0 hive version hive 注意事项: hive的log4j和hadoop的log4j包冲突 jdbc连接需要配置 hive数据库的原数据要配置 hive官方文档 https://cwiki.apache.org
输完以上命令后,要稍等一下, Logstash startup completed 字样出现后,才表示 logstash 已经启动,之后的输入,才会获得相应响应
5,安装Hive 上传解压 cd /opt/bdp/ rz tar -zxvf apache-hive-1.2.1-bin.tar.gz rm -rf pache-hive-1.2.1-bin.tar.gz 配置文件 vim/opt/bdp/apache-hive-1.2.1-bin/conf/hive-site.xml <? --默认为/user/hive/warehouse,用于配置Hive默认的数据文件存储路径, 这是一个HDFS路径。可按需调整。 bdp/apache-hive-1.2.1-bin/conf/hive-site.xml <? 交互方式 1.hive cli 2.beeline -u jdbc:hive2://bd1603:10000 -n root 3.hive -e|f beeline -e|f 7,Hive元数据
[喵咪大数据]Hive2搭建 说到Hadoop生态有一个不得不提的组件那就是<Hive>,Hive是基于Hadoop结构化存储引擎,能够存储海量的数据,Hive提供了类SQL的方式对数据进行查询检索汇总 附上: HIVE官网地址:Apache Hive TM 喵了个咪的博客:w-blog.cn 1.环境配置 hadoop集群环境需要提前配置好,可以在master上进行搭建也可以单独一台机器进行搭建这里使用一台独立的 centos7.X 64位服务器进行Hive服务搭建并且连接到之前的Hadoop集群 通过oneinstack配置环境 > mkdir -p /app/install && cd /app/install java.lang.IllegalArgumentException: java.net.URISyntaxException: Relative path in absolute URI: ${system:java.io.tmpdir%7D /$%7Bsystem:user.name%7D 需要将 hive-site.xml 中的 ${system:java.io.tmpdir} 和 ${system:user.name} 分别替换成 /tmp