首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Greenplum

    Greenplum迁移指南

    Greenplum迁移指南 目录 Greenplum迁移指南 1 目 1 录 1 第一节 Greenplum数据迁移方法论 2 1.1 为什么要进行数据迁移 2 1.2 迁移整体的流程 2 第二节 Greenplum 2、性能:Greenplum相对传统关系型数据库有明显的性能提升,多个用户从Oracle迁移到Greenplum后,性能有几十倍的提升。 ,迁移至Greenplum性能在同一量级,但因为数据节点交互延迟会略有增加 并发数据加载场景 1秒以内 可以迁移至Greenplum,需要将逐笔插入操作改为微批量插入,由于Greenplum MPP架构的优势 ,会导致性能有较大的损失,甚至无法满足业务的需求,请关注Greenplum的研发进展和新版本性能,Greenplum社区正在不断增强高并发事务性特性。 第四节PostgreSQL到Greenplum的数据迁移 5.1 一种平滑的解决方案 Greenplum与PostgreSQL无论在语法还是使用方式上,都基本上相似,所以从PostgreSQL迁移到Greenplum

    2.3K30发布于 2021-01-27
  • 来自专栏Greenplum

    Greenplum高级使用

    9 Greenplum高级使用 9.1 常用查询语句 9.1.1 查看表的数据分布情况 stagging=#  select gp_segment_id,count(1) from  tablename errmsg | text | --错误信息 rawdata | text | --整行数据 rawbytes | bytea | --行大小 Distributed randomly 详细的说明请查看:Greenplum ----------------------------------------------------------- -------------------  PostgreSQL 8.3.23 (Greenplum PQO version 2.75.0 (9 rows) Time: 17.226 ms 9.3.2 名词解释 t_person4insert3 : 索引的名字,说明此查询已经使用索引了 slice: Greenplum segment: 每个sdw中设置两个primary(greenplum安装时gpinitsystem使用的文件中设置),所以看到的segment是48。

    1.7K10发布于 2019-01-28
  • 来自专栏Hadoop数据仓库

    Greenplum修改hostname

    address='更改之后的主机名' where hostname='更改之后的主机名'; \q # 关闭GP Master gpstop -m # 启动GP gpstart -a 参考:【GREENPLUM

    93650编辑于 2022-11-02
  • 来自专栏桥路_大数据

    产品图鉴:Greenplum

    Greenplum是老牌的MPP数据仓库,查询稳定性很强,SQL支持非常全面(支持ANSI SQL 2008和SQL OLAP 2003扩展;支持ODBC和JDBC应用编程接口。 ,基于PostgreSQL构建而成,主要面向结构化数据OLAP计算,Greenplum在6.0版本大大的提高了对OLTP的支持,tpcb性能提升60倍,单节点查询达到80000TPS(Transactions Greenplum 6.0版本引入了更多的开源组件,包括Kubernetes和Apache MADlib等,还增强了对云计算环境的支持。 其实运维问题,是MPP数据仓库常见的问题,Greenplum相对明显。 所以总结起来,Greenplum是一个老牌MPP数据仓库,整体比较均衡,适合中小规模数据的OLAP分析(MPP数据库在架构上注定会有扩展上限),在6.0版本之后,能够同时支持OLTP处理,成为OTAP数据仓库

    65640编辑于 2023-10-16
  • 来自专栏大数据生态

    Greenplum 操作锦囊

    背景在大数据领域,Greenplum 是一个广泛使用的开源数据仓库工具,特别受到数据分析师、数据科学家和企业的青睐,因为它能够提供高效、高性能的数据分析功能。 然而,掌握 Greenplum 的操作技巧并非易事,为了让用户更快速地掌握这些技巧,本文将为您提供 Greenplum 操作的锦囊妙计。 希望通过本文,您能够快速熟悉 Greenplum,提升工作效率和数据分析能力。查询类1. 启停在master节点上的install目录export MASTER_DATA_DIRECTORY=/data/greenplum/master/gpseg-1停止gpstopgpstop -M fast /gpactivatestandby -d /data/greenplum/master/gpseg-16.

    1.9K133编辑于 2023-11-08
  • 来自专栏Greenplum

    Greenplum快速上手

    Greenplum快速上手 目录 快速上手Greenplum 1 目录 1 1 Greenplum的介绍 2 1.1 Greenplum产品发展历程 2 2 Greenplum市场地位 3 3 Greenplum 功能 5 3.3.3 Segment Hosts功能 5 3.4 Greenplum DB真正完全无共享的MPP数据库 6 4 Greenplum机器选型 6 4.1 机器选型一般的配置 6 5 Greenplum 软件安装 11 5.9 Greenplum 软件安装(简历互信和目录) 11 5.10 Greenplum 软件安装(校验性能) 11 5.11 Greenplum 数据库初始化 12 5.12 配置standby 3 Greenplum架构设计 3.1 Scale up架构 3.2 Greenplum架构图 3.3 Greenplum架构组成 3.3.1 Master Hosts功能 1、系统入口点 2、数据库监听器进程 Greenplum数据库,不支持网络伟岸系统(NFS) 3、Greenplum数据库不直接支持共享储存的其他功能(如重复数据消除或复制),但只要不干预Greenplum数据库的预期操作,就可以在储存供应商的纸下使用这些功能

    1.7K110发布于 2020-08-26
  • 来自专栏运维前线

    Greenplum编译安装

    Greenplum部署手册 一、环境准备 操作系统 ARM-Neokylin7.6-64bit 安装包 greenplum6.9.1(源码) 设置语言 echo "export LANG=en_US.UTF #vim ~/.bash_profile 添加source /opt/gpdb/greenplum_path.sh #source ~/.bash_profile # vim all_hosts_file Binary Version: 'postgres (Greenplum Database) 6.0.0-beta.1 build dev' 20200911:15:21:33:052842 gpstart :SZD-BDL0014729:gpadmin-[INFO]:-Greenplum Catalog Version: '301908232' 20200911:15:21:33:052842 gpstart Master instance in admin mode 20200911:15:21:33:052842 gpstart:SZD-BDL0014729:gpadmin-[INFO]:-Obtaining Greenplum

    2.2K21发布于 2020-09-22
  • 来自专栏Greenplum

    Greenplum迁移指南

    Greenplum迁移指南 Greenplum迁移指南 目录 第一节 Greenplum数据迁移方法论 1.1 为什么要进行数据迁移 1.2 迁移整体的流程 第二节Greenplum数据迁移工具 2、性能:Greenplum相对传统关系型数据库有明显的性能提升,多个用户从Oracle迁移到Greenplum后,性能有几十倍的提升。 ,迁移至Greenplum性能在同一量级,但因为数据节点交互延迟会略有增加 并发数据加载场景 1秒以内 可以迁移至Greenplum,需要将逐笔插入操作改为微批量插入,由于Greenplum MPP架构的优势 ,会导致性能有较大的损失,甚至无法满足业务的需求,请关注Greenplum的研发进展和新版本性能,Greenplum社区正在不断增强高并发事务性特性。 第五节 PostgreSQL到Greenplum的数据迁移 5.1 一种平滑的解决方案 Greenplum与PostgreSQL无论在语法还是使用方式上,都基本上相似,所以从PostgreSQL迁移到Greenplum

    2.4K30发布于 2021-03-11
  • 来自专栏数据库相关

    Greenplum 5.16.0初探

    set-hostname dw-greenplum-2 hostnamectl set-hostname dw-greenplum-3 hostnamectl set-hostname dw-greenplum -1 mdw 192.168.2.12  dw-greenplum-2 sdw1 192.168.2.13  dw-greenplum-3 sdw2 192.168.2.14  dw-greenplum 配置 hostlist 和 seg_hosts文件 su - gpadmin echo  'source /opt/greenplum/greenplum-db/greenplum_path.sh'  /greenplum/ => mkdir /opt/greenplum/greenplum-cc-web-4.5.1 => chown gpadmin:gpadmin /opt/greenplum/greenplum-cc-web 然后,添加下环境变量 echo 'source  /opt/greenplum/greenplum-cc-web-4.5.1/greenplum-cc-web-4.5.1/gpcc_path.sh' >

    1.4K31发布于 2019-09-18
  • 来自专栏光城(guangcity)

    GreenPlum内核升级

    最近在研究pg14的create table like语句,如下命令会被拆分成若干个statement,在greenplum中QD与QE的处理还不一样,会将statement从QD分发到各个QE上。

    1.5K10编辑于 2022-12-02
  • 来自专栏小麦苗的DB宝专栏

    Greenplum MPP 架构

    1.Greenplum MPP架构 Greenplum(以下简称GPDB)是一款开源数据仓库。 1.1.Greenplum Master Master只存储系统元数据,业务数据全部分布在Segments上。 1.3.Interconnect Interconnect是Greenplum架构中的网络层,是GPDB系统的主要组件,默认情况下,使用UDP协议,但是Greenplum会对数据包进行校验,因此可靠性等同于 Greenplum数据库将数据存储在多个segment实例中,每一个实例都是Greenplum数据库的一个PostgreSQL实例,数据依据建表语句中定义的分布策略在segment节点中分布。 详见Greenplum 数据库管理工具指南中的gpaddmirrors参考页。

    3.2K10编辑于 2023-11-27
  • 来自专栏光城(guangcity)

    Greenplum SysCache and RelCache

    When accessing database tables, some information needs to be obtained from system tables. In order to improve retrieval efficiency, PostgreSQL provides caches, including SysCache and RelCache.

    73020编辑于 2022-12-02
  • 来自专栏技术最杂谈

    Greenplum性能分析

    http://tapd.oa.com/Greenplum/markdown_wikis/view/#1010134541008425443 2,磁盘性能测试。 refill_buffers --norandommap --randrepeat=0 --group_reporting --name=fio-write --size=10G --filename=/data/greenplum

    1.7K62发布于 2020-10-22
  • 来自专栏sdf

    greenplum资源队列

    greenplum资源队列 1、创建资源队列语法 Command:     CREATE RESOURCE QUEUE Description: create a new resource queue 代价由Greenplum数据库查询优化器(正如查询EXPLAIN 输出显示的)确定的查询的 估计共代价 进行衡量的。 因此,管理员必须要熟悉在系统中执行的典型查询,以对队列设置一个合理的阀值。 成本由Greenplum数据库查询优化器(正如查询 EXPLAIN 输出所示)确定的查询的估计总成本所衡量。 因此,管理员必须熟悉通常在系统上执行的查询,以便为被认为是小型查询设置适当的成本。

    75200发布于 2019-12-04
  • 来自专栏summerking的专栏

    docker安装Greenplum

    Greenplum是业界最快最高性价比的关系型分布式数据库,它在开源的PostgreSQL的基础上采用MPP架构(Massive Parallel Processing,海量并行处理),具有强大的大规模数据分析任务处理能力 | ---------------------------------------------------------------------- This is a demo of the Greenplum Binary Version: 'postgres (Greenplum Database) 4.3.99.00 build dev' 20201127:07:28:50:000017 gpstart :487243160c73:gpadmin-[INFO]:-Greenplum Catalog Version: '301605129' 20201127:07:28:50:000017 gpstart Binary Version: 'postgres (Greenplum Database) 4.3.99.00 build dev' 20201127:07:38:52:000187 gpstart

    2.7K20编辑于 2022-10-27
  • 来自专栏Greenplum

    greenplum时区避坑

    修改以下参数把美国中部时区修改成中国标准时区(CST) 1、中国标准时区(CST)和美国中部时区(CST)重名 2、GP默认会将CST识别为美国中部时区 3、导致国内时区为CST的服务器在事件计算时出现意外结果 4、解决方法      4.1 修改GP安装目录下/share/postgresql/timezonesets/Default      4.2  找到CST - 21600这行,修改为CST 28800      4.3 所有Segment和Master服务器全部修改     4

    1.1K80发布于 2020-05-28
  • 来自专栏从ORACLE起航,领略精彩的IT技术。

    Greenplum测试环境部署

    -4.3.4.2-build-1-RHEL5-x86_64.zip到Master **解压** unzip greenplum-db-4.3.4.2-build-1-RHEL5-x86_64.zip **安装** /bin/bash greenplum-db-4.3.4.2-build-1-RHEL5-x86_64.bin 5.在所有的节点上安装配置Greenplum 配置/etc/hosts 192.168.9.123 /greenplum_path.sh $ cd /usr/local/greenplum-db $ gpssh -f hostfile_exkeys -e ls -l $GPHOME 互信此时应该是可用的 验证OS设置 先建立一个hostfile_gpcheck文件 mdw smdw sdw1 验证 $ source /usr/local/greenplum-db/greenplum_path.sh $ Ensure that the greenplum_path.sh file is sourced 20150403:11:13:00:002886 gpinitsystem:mdw:gpadmin-[

    2K40发布于 2019-05-24
  • 来自专栏小麦苗的DB宝专栏

    GreenPlum的最佳配置

    这种情形下, Greenplum数据库会基于主机系统的相关信息来计算一个最佳的PostgreSQL时区匹配值。 作为最佳实践,应该配置Greenplum数据库和主机系统采用已知的被支持的时区。 采用当前系统时区和Greenplum数据库 时区文件(该信息可能自上次重启后已经从IANA数据库更新)来匹配,这样做可以设置好Greenplum数据库master和 segment实例的时区,防止Greenplum 使用gpconfig工具 设置和显示Greenplum数据库时区。例如,以下命令显示Greenplum数据库时区并设置时区为US/Pacific。 重启Greenplum数据库的命令为 “gpstop -ra”。系统视图 pg_timezone_names提供Greenplum数据库时区相关的信息。 2.文件系统 XFS是Greenplum数据库数据目录的最佳实践文件系统。

    79110编辑于 2023-11-28
  • 来自专栏PostgreSQL研究与原理解析

    GreenPlum数据分布机制

    一、介绍 GreenPlum是Coodinator/Segment架构,集群通常由一个Coodinator节点和一个standby coodinator节点以及多个segment节点组成,其中数据放置在

    73330编辑于 2022-09-06
  • 来自专栏杨建荣的学习笔记

    Greenplum集群部署小记

    Greenplum的分布式架构方案MPP对于海量数据处理还是很给力的,今天专门抽时间搭建了一下测试环境。 首先来简单看下Greenplum的架构,这个和Oracle,MySQL还是大不同。 source /usr/local/greenplum-db/greenplum_path.sh 软件的部署就是解压的过程,没什么可说的了。 说下创建数据库吧。 =testDB 核心就是配置文件 init_seg_mirror_config了,内容如下: ARRAY_NAME="Greenplum" MACHINE_LIST_FILE=/usr/local/greenplum-db /data/greenplum_data/gpdatap2 ) MASTER_HOSTNAME=gp01 MASTER_DIRECTORY=/data/greenplum_data/gpmaster /gpdatam2 /data/greenplum_data/gpdatam1) DATABASE_NAME=testDB 安装使用如下的方式即可。

    1.9K20发布于 2018-07-26
领券