首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏大数据探索

    Superset sqllab连接hive无法显示表信息的问题

    使用superset,连接hive时(hive的引擎是spark),表名和表信息无法加载,加载出来了一堆表的数据库名图片二、解决问题1、原因 这个问题的原因是superset里面是使用pyhive 去连接,表名加载是通过"show tables in {dbname}"去获取的,而spark sql和hive sql的"show tables"的执行返回结果格式不一样,pyhive最新版本20.0.1 spark sql图片hive sql 图片然后我们找到pyhive关于show tables的代码,位置:~/python3.8/site-packages/pyhive/sqlalchemy_hive.pydef

    1.9K30编辑于 2022-10-17
  • 来自专栏极客生活

    python读取hive数据最佳实践

    使用pyhive库来连接hive server2提供的对外接口,使用sql语句来对数据进行查询,并处理返回结果。 安装依赖: yum install python-pip gcc gcc-c++ python-virtualenv cyrus-sasl-devel pip install pyhive pip install 代码如下: # -*- coding: utf-8 -*- from pyhive import hive conn = hive.Connection(host='HiveServer2 host' demo_table limit 10') for result in cursor.fetchall(): print result 参考: https://github.com/dropbox/PyHive

    3K20发布于 2018-08-28
  • 来自专栏python3

    Python操作Hive的两种方法总结

    方法一:使用PyHive库 安装依赖包:其中sasl安装可能会报错,可以去https://www.lfd.uci.edu/~gohlke/pythonlibs/#sasl下载对应版本安装。 pip install sasl pip install thrift pip install thrift-sasl pip install PyHive Python脚本代码操作: from pyhive ** VALUES ({},'username{}')".format(value, str(username)) cursor.execute(sql) # 下面是官网代码: from pyhive

    7.5K20发布于 2020-01-06
  • 来自专栏最新最全的大数据技术体系

    助力工业物联网,工业大数据之数仓维度层DWS层构建【十二】

    Oracle:cx_Oracle conn(host,port,user,passwd,sid) Hive/SparkSQL:pyHive SparkSQL用法 编程方式:python spark.sql(“”) spark-submit 优点:灵活 场景:DSL 提交SQL:ThriftServer 场景:SQL,调度开发 流程 JDBC | PyHive

    78311编辑于 2023-05-27
  • 来自专栏加米谷大数据

    Python连接Hive操作数据库

    Python客户端连接HiveServer2 python中用于连接HiveServer2的客户端有3个:pyhs2,pyhive,impyla。 官网的示例采用的是pyhs2,但pyhs2的官网已声明不再提供支持,建议使用impyla和pyhive

    4.9K20发布于 2018-07-25
  • 来自专栏最新最全的大数据技术体系

    助力工业物联网,工业大数据之ODS层构建:需求分析【八】

    实施 安装Python3.7环境 项目使用的Python3.7的环境代码,所以需要在Windows中安装Python3.7,与原先的Python高版本不冲突,正常安装即可 创建Python工程 安装PyHive install thrift-sasl # 安装python操作oracle包 pip install cx-Oracle # 安装python操作hive包,也可以操作sparksql pip install pyhive 中工程结构的构建 03:ODS层构建:代码导入 目标:实现Python项目代码的导入及配置 实施 Oracle本地驱动目录:将提供的instantclient_12_2目录放入D盘的根目录下 PyHive

    96040编辑于 2023-04-16
  • 别急着上算法,咱先把数据整明白:大数据分析的5个基本步骤,你都搞对了吗?

    # 连接Hive查询用户日志(用PyHive)from pyhive import hiveconn = hive.Connection(host='your-hive-server', port=10000

    51310编辑于 2025-04-29
  • 来自专栏云上实验室

    基于SQL语言实现机器学习以及深度学习

    当然直接通过pymysql,pyhive都可以实现连接数据库进行交互。 通过我之前写的一系列文章pyhive或者是pymysql连接数据库很容易实现这个功能。

    54540编辑于 2024-12-24
  • 来自专栏逸繁

    win10下apache superset的使用

    install mysqlclient mysql:// Postgres pip install psycopg2 postgresql+psycopg2:// Presto pip install pyhive psycopg2:// MSSQL pip install pymssql mssql:// Impala pip install impyla impala:// SparkSQL pip install pyhive

    2.2K20发布于 2019-08-23
  • 来自专栏啄木鸟软件测试

    用Java、Python来开发Hive应用

    "}, 3 用Python来开发Hive应用 pip3 pip install sasl pip install thrift pip install thrift-sasl pip install PyHive Python import pandas as pd from pyhive import hive from sqlalchemy import create_engine from pyhive

    39110编辑于 2024-09-10
  • 来自专栏bgmonkey

    使用python连接presto-202104

    presto-python-clienthttps://github.com/prestodb/presto-python-client,第三方也有提供pyhivehttps://github.com/dropbox/PyHive

    3.3K20发布于 2021-04-09
  • 来自专栏啄木鸟软件测试

    基于Python访问Hive的pytest测试代码实现

    根据《用Java、Python来开发Hive应用》一文,建立了使用Python、来开发Hive应用的方法,产生的代码如下(做了修改): import pandas as pd from pyhive import hive from sqlalchemy import create_engine from pyhive import hive class Hive: def

    36910编辑于 2024-09-10
  • 来自专栏yeedomliu

    Hadoop数据仓库工具Hive

    .> 在 HIVE 中创建数据库 语法 Create database <DatabaseName> 示例 from pyhive import hive# 建立连接conn = hive.Connection 'CREATE DATABASE userdb')# 关闭连接conn.close() 在 HIVE 中删除数据库 语法 Drop database <DatabaseName> 示例 from pyhive FORMAT DELIMITEDFIELDS TERMINATED BY '\t'LINES TERMINATED BY '\n'STORED AS TEXTFILE; python 示例 from pyhive

    1.1K20编辑于 2023-09-03
  • 来自专栏数据社

    从0到1搭建大数据平台之计算存储系统

    比如这个项目:PyHive(https://github.com/dropbox/PyHive) ? 借助Python,我们可以很好的弥补Hive在复杂处理的一些缺陷,同时也能更好的开发ETL任务。

    1.4K30发布于 2020-08-04
  • 来自专栏python3

    简单:SuperSet

    openpyxl,jsonlines,linear-tsv,xlrd,ijson,cchardet, 制表者,isodate,rfc3986,tableschema,pydruid,sqlparse,pyhive 2.4.11 pandas-0.23.4 parsedatetime-2.4 pathlib2-2.3.3 polyline-1.3.2 pycparser-2.19 pydruid-0.5.0 pyhive

    2.2K10发布于 2020-01-02
  • 来自专栏最新最全的大数据技术体系

    助力工业物联网,工业大数据之ODS层构建:代码结构及修改【九】

    Oracle库包:cx_Oracle cx_Oracle.connect(ORACLE_USER, ORACLE_PASSWORD, dsn) Hive/SparkSQL:安装Python操作Hive库包:PyHive one_make_ods step2:如何使用PyHive创建数据库?

    88910编辑于 2023-04-16
  • 来自专栏数据科学与人工智能

    金融科技:数据导入技术

    2 使用pyhive库访问和获取大数据平台Hive数仓的数据表 3.2 R语言 使用RODBC包从数据导入数据表,需要在Win系统或者Linux先配置好ODBC。

    1.2K20编辑于 2022-03-29
  • 【详解】HiveThrift服务

    环境准备安装依赖:首先需要安装​​pyhive​​库,这是一个用于连接Hive的Python库。 示例代码以下是一个简单的Python脚本,演示如何连接到Hive并执行SQL查询:from pyhive import hive# 连接到Hiveconn = hive.Connection(host=

    48000编辑于 2025-01-22
  • 来自专栏SQL 周周练

    【SQL周周练】一句 SQL 如何帮助 5 个人买到电影院最好的座位?

    与前两期不同,之前我都是将pd.DataFrame采用to_csv转为csv文件;然后用pyHive在Hive中建好表,再使用load data local inpath的方法导入数据。 关于 alter table 语句的使用格式和官方文档,我已经在代码注释中说明:from pyhive import hive# 配置连接参数host_ip = "127.0.0.1"port = 10000username 我通过使用 PyHive 包实现 Python 操作 Hive。我个人电脑部署了 Hadoop 及 Hive,但是没有开启认证,企业里一般常用 Kerberos 来进行大数据集群的认证。4.

    40901编辑于 2025-04-28
  • hive建表语句转mysql

    Python代码示例:pythonCopy code# 导入必要的库from pyhive import hiveimport pymysql# 连接Hive服务器hive_conn = hive.Connection

    1.2K10编辑于 2024-04-22
领券