首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏不温卜火

    HBase快速入门系列(3) | Hbase的shell基本操作

    进入HBase客户端命令行 [bigdata@hadoop002 hbase]$ bin/hbase shell ? 2. 查看帮助命令 hbase(main):001:0> help ? 3. 创建表 hbase(main):003:0> create 'student','info' ? 2.查看表的具体类型 hbase(main):005:0> desc 'student' ? 3. 变更表信息 将info列族中的数据存放3个版本: hbase(main):022:0> alter 'student',{NAME=>'info',VERSIONS=>3} hbase(main):022 :0> get 'student','1001',{COLUMN=>'info:name',VERSIONS=>3} ?   

    68010发布于 2020-10-28
  • 来自专栏大数据那些事

    Hbase3)——desc、alter、时间戳

    (1)加列族 先查看此表下有什么列族: 添加一个列族: 查看: (2)删除列族: (3)查看历史版本 默认的历史版本hbase只会显示一个: 如果我们要查看多个 ,则要修改: 此时再查看结果: 可以看见Hbase采用追加的方式加入数据

    1K10发布于 2020-11-11
  • 来自专栏大数据成长之路

    HBase3个重要机制

    本篇博客,小菌为大家带来的是关于HBase3个重要机制。 1.flush 机制 1. (hbase.hregion.memstore.flush.size) 默认:128M 单个region里memstore的缓存大小,超过那么整个HRegion就会flush。 3. (hbase.hstore.compactionThreshold) 默认:超过3个 一个store里面允许存的hfile的个数,超过这个个数会被写到新的一个hfile里面 也即是每个region的每个列族对应的 (先flush一小部分,等后面数据达到阈值在flush后 面的数据) 好处:比一次flush效率高 什么时候触发合并 hbase.hstore.compactionThreshold: 默认:3个 (flush文件的数量超过3个进行合并) compact机制 默认3个 小的storeFile 文件达到3个,合并成大的storeFile文件。

    99730发布于 2021-01-26
  • 来自专栏全栈程序员必看

    sublime text3 替换(sublime替换成换行符)

    我遇到一个文章,需要把所有的 (数字) 换为 [数字] 于是我使用 Sublime Text的替换 首先,我们需要打开正则使用“Alt+R” 或打开“Ctrl+h”选择正则。 于是在替换写“[ 1\]”,其中 1\]”,其中0就是所有的,$1就是第一个括号。 如何使用正则可以去看正则表达入门。 Sumlime 还可以创建代码行,做法也很简单。

    4.5K10编辑于 2022-07-25
  • 来自专栏积累沉淀

    hbase集群安装(3)-安转Hadoop

    安转Hadoop 我的安装路径是根目录下的software 把Hadoop压缩包解压到software目录下 解压后查看目录 要修改的配置文件有四个 修改hadoop-env.sh 修改core-si

    1.1K100发布于 2018-01-11
  • 来自专栏全栈程序员必看

    java设计模式3,里氏替换原则

    一、里氏替换原则定义 在面向对象的程序设计中,里氏替换原则(Liskov Substitution principle)是对子类型的特别定义。 二、里氏替换原则的作用 里氏替换原则是实现开闭原则的重要方式之一; 解决了继承中重写父类造成的可复用性变差的问题; 是动作正确性的保证,即类的扩展不会给已有的系统引入新的错误,降低了出错的可能性。 此时继承父类实现的敖丙并不满足里氏替换原则,也就是说,此时的子类不能承担原父类的功能,直接给哪吒用,因为称号、师傅、混元珠也都也不一样嘛。 System.out.println("魔丸"); } /** * 重大事件 */ public void event(){ System.out.println("哪吒闹海"); } } 3、 ,子类随时可以替换英雄类。

    1K30编辑于 2022-11-18
  • 来自专栏python3

    python 3文件内容替换

    在原有的文件上,修改替换,并放到新的文件里 old = open('day','r') new = open('new_day','w') old_replace = input('please replace

    1.3K10发布于 2020-01-03
  • 来自专栏cloudskyme

    跟我一起云计算(3)——hbase

    HBase是Apache的Hadoop 项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。 管理HRegionServer的负载均衡,调整Region分布 3. 在Region Split后,负责新Region的分配 4. 所谓的列式存储就是根据CF分开存储(每个CF对应一个Store),这种设计非常适合于数据分析的情形 3)时间戳(TimeStamp) -- 每个Cell可能又多个版本,它们之间用时间戳区分 4)单元格( hbase存储结构 HBase 是基于列的数据库,让我们看一下关系型数据库和hbase数据库存储的对比。 行式存储和列式存储对比: 行式存储 ? 上图是个很典型的数据储存方式,我把每条记录分成3部分:主键、记录属性、索引字段。我们会对索引字段建立索引,达到二级索引的效果。

    1.4K50发布于 2018-03-20
  • 来自专栏LhWorld哥陪你聊算法

    HBase篇--初始Hbase

    一.前述 1.HBase,是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库。 3.主要用来存储非结构化和半结构化的松散数据(列存 NoSQL 数据库)。 二.Hbase数据模型 ? 2.1 ROW  KEY(相当于关系型数据库中的ID) 决定一行数据 按照字典顺序排序的。 HBase把同一列族里面的数据存储在同一目录下,由几个文件保存。 2.3 Timestamp时间戳(相当于版本!!!) 三.Hbase架构 ? 3.1 Client 包含访问HBase的接口并维护cache来加快对HBase的访问 3.2 Zookeeper 保证任何时候,集群中只有一个master(HA) 存贮所有Region的寻址入口。

    5.6K20发布于 2018-09-13
  • 来自专栏Java小白成长之路

    剑指offer第3题:替换空格

    替换空格 剑指Offer05:替换空格【简单题】 ? 题目描述 解法一: 直接遍历整个字符串,对于空格的地方,使用%20进行替换,对于其他部分我们依旧直接append就好。

    58620发布于 2020-07-15
  • 来自专栏Devops专栏

    pip pip3 替换国内镜像源

    存在问题 在采用默认 pip3 安装第三方库的时候,经常会出现超时的情况。 pip. _vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host='files.pythonhosted.org', port= 这时候就需要替换镜像源为国内的镜像源了。 /pypi/simple/ 查看执行是否替换镜像,如下: ? 可以看到镜像已经替换阿里云的镜像。 Windows下更换镜像源 打开我的电脑,在地址栏中输入 %APPDATA% 按回车跳转到目标目录。

    61.4K22发布于 2019-10-14
  • 来自专栏c++

    【Linux】进程控制(3)进程程序替换

    一、理解进程程序替换 如果我们想要在一个进程里面执行另一个程序,那么就需要进行程序替换,也就是父进程创建一个子进程,然后通过程序替换的方式将想要执行的程序交给这个子进程去去执行。 为什么一定是父进程创建子进程 + 子进程程序替换的方式?因为程序替换会直接重置页表,虚拟地址用的又是新的程序的。如果直接由父进程进行程序替换的话,父进程它本身原来要执行的程序就相当于直接销毁了。 如果程序替换成功,那么会直接执行替换后的程序的代码,不会有返回值,如果执行失败了会返回-1。所以exec系列函数只有出错的返回值,没有成功的返回值。 示例: 1 #include<unistd.h> 2 #include<stdio.h> 3 #include<sys/types.h> 4 #include<wait.h sid = waitpid(id, NULL, 0); 22 printf("我是一个父进程,我回收了子进程\n"); 23 return 0; 24 } myfile.c 3

    16710编辑于 2026-01-14
  • 来自专栏大数据那些事

    Hbase(4)——hive on hbase

    可以用如下语句在hive上实行创表,然后hbase上会出现对应的表 ? ? 此时可以看见basketball2已经在hbase上建立了 ps:CREATE TABLE basketball2(num int,team string,state string) STORED BY ‘org.apache.hadoop.hive.hbase.HBaseStorageHandler’ WITH SERDEPROPERTIES (“hbase.columns.mapping” = “ :key,player:team,player:state”) TBLPROPERTIES (“hbase.table.name” = “basketball2”); create table后面跟hive 上要创建的表名,mapping相当于映射,:前面没有东西就相当于是hbase里的rowkey,后面的player相当于列族里的Column family,而team和state相当于Column qualifier

    4.9K10发布于 2020-11-11
  • 来自专栏生如夏花的个人博客

    Hbase(四):Hbase原理

    Hbase(四):Hbase原理 Hbase的工作方式 region的分裂和结构 hbase表中的数据按照行键的字典顺序排序 hbase表中的数据按照行的的方向切分为多个region 最开始只有一个 写入数据到hdfs的过程其实是不断追加hfile的过程 Hbase写入数据 数据写入hbase时 先在hlog中记录日志 再修改memstore 直接返回成功 这样 不需要真正等待写入hdfs的过程 所以很快 由于hbase中的数据天然排序 再加上索引 整个查询也可以非常的快 Hbase中的region的寻址 在hbase中有一个hbase:meta表,其中存放了 表和region和regionSever 之间的对应关系信息 ​ 支持增、删、读、改、顺序扫描操作 ​ 牺牲了一部分读的性能换取了高效写入能力 Hbase系统架构 hbase中的老大叫hmaster 小弟叫hregionServer 客户端叫Client 的数据是可靠的 ​ 基于hdfs,由hdfs的可靠性保证了hbase的可靠性–即数据可以有多个备份 ​ 利用zookeeper实现了HA,即使某一台机器挂掉另外的机器也可以很快的替换Hbase与Hive

    5K10发布于 2020-11-24
  • 来自专栏章鱼carl的专栏

    HBaseHBase之what

    (2)列族(column family):HBase所谓的列式存储就是根据column failmy (3)列限定符(column qualifier):列限定符定位单元,列限定符可以在存储时动态添加 (3)Hlog数量上限 前面说到Hlog为了保证Hbase数据的一致性,那么如果Hlog太多的话,会导致故障恢复的时间太长,因此Hbase会对Hlog的最大个数做限制。 Region的拆分 Hbase Region的拆分策略有比较多,比如除了3种默认过的策略,还有DelimitedKeyPrefixRegionSplitPolicy、KeyPrefixRegionSplitPolicy 3.SteppingSplitPolicy SteppingSplitPolicy是在Hbase 2.0版本后的默认策略,拆分规则为:If region=1 then:flush size * 2 else 查询简单(基于rowkey或者rowkey范围查询) (3) 不涉及到复杂的关联 有几个典型的场景特别适合使用Hbase来存储: (1) 海量订单流水数据(长久保存) (2) 交易记录 (3) 数据库历史数据

    4.4K40编辑于 2022-03-31
  • 来自专栏章鱼carl的专栏

    HBaseHBase之how

    (2)HBase Client不需要我们维护连接池,Connection对象已经帮我们做好了。 (3)Connection是线程安全的。 (3)Column Family:HBase可以将一行数据分成不同列的集合,这些列的集合称为Column Family,不同的Column Family文件被存储在不同的路径中。 数据分布影响RowKey的设计,更进一步影响如何合理的划分Region信息 (3)数据生命周期? (3)而后,结合具体的负载特点,再对选取的RowKey字段值进行改造,组合字段场景下需要重点考虑字段的顺序。 5.避免数据热点的方法 - Hashing 基于RowKey的完整或部分数据进行Hash,而后将Hashing后的值完整替换原RowKey或部分替换RowKey的前缀部分。

    4.2K20编辑于 2022-03-31
  • 来自专栏岑玉海

    Hbase 学习(十) HBase Snapshots

    /bin/hbase shell hbase> snapshot 'myTable', 'myTableSnapshot-122112' 3.列出已经存在的快照 $ . /bin/hbase shell hbase> list_snapshots 4.删除快照 $ . /bin/hbase shell hbase> delete_snapshot 'myTableSnapshot-122112' 5.从快照复制生成一个新表 $ . /bin/hbase shell hbase> disable 'myTable' hbase> restore_snapshot 'myTableSnapshot-122112' 提示:因为备份( 7.复制到别的集群当中 该操作要用hbase的账户执行,并且在hdfs当中要有hbase的账户建立的临时目录(hbase.tmp.dir参数控制) 采用16个mappers来把一个名为MySnapshot

    5.3K80发布于 2018-03-01
  • 来自专栏Windows技术交流

    uupdump.net替换3个文件的url

    https://blog.csdn.net/weixin_43392794/article/details/140670505解决方案:在uupdump.net下载压缩包后,解压,进入到files目录,替换 get_aria2.ps1和converter_windows中的3个url为国内可访问的url假设当前路径是E:\26100.2314_amd64_zh-cn_serverdatacenter_c4bd87c1 记录当前文件夹路径为$curpath$curpath根目录有2个记事本文件:converter_windows和get_aria2.ps1将这2个文件中的"uupdump.net/misc/aria2c.exe"替换为 "git.uupdump.net/uup-dump/misc/raw/branch/master/aria2c.exe"将这2个文件中的"uupdump.net/misc/7zr.exe"替换为"git.uupdump.net /uup-dump/misc/raw/branch/master/7zr.exe"将这2个文件中的"uupdump.net/misc/uup-converter-wimlib.7z"替换为"git.uupdump.net

    72310编辑于 2025-01-15
  • 来自专栏数据技术

    使用 HBase - HBase Shell 命令

    例如,VERSIONS => 3是指此单元格内的数据可以保留最近的 3 个版本,BLOCKCACHE => true是指允许读取数据时进行缓存。 1.1.3. get 'namespace:table', 'RowKey', {COLUMN => 'CF:CQ', VERSIONS => 3} 为了更清晰地看到效果,查询前先插入新的数据进行覆盖: hbase: 3 HBase 过滤器 在 HBase 中,get 和 scan 的查询命令都可以使用过滤器来设置查询结果的输出范围,类似于 SQL 中的 where 查询条件。 使用 show_filters 命令可以查看当前 HBase 支持的过滤器类型: 图3-1:查看 HBase 过滤器类型 使用过滤器的命令语法格式如下: scan 'namespace:table', = 比较器包含: 图3-2:HBase 过滤比较器 下面使用 scan 命令介绍常见的过滤器使用方法,get 命令如此类推,不同的是 get 命令需要指定行键。 3.1 行键过滤器 3.1.1.

    12.8K31编辑于 2022-01-18
  • 来自专栏LhWorld哥陪你聊算法

    HBase篇--HBase常用优化

    目前Hbase并不能很好的处理超过2~3个column family的表。 :默认值为 3,表示至少需要三个满足条件的store file时,minor compaction才会启动 hbase.hstore.compaction.max 默认值为10,表示一次minor compaction 2)通过调用HTable.setScannerCaching(int scannerCaching)进行配置;3)通过调用Scan.setCaching(int caching)进行配置。 至于缓存的替换策略,可以考虑LRU等常用的策略。 3.6 Blockcache !!! 3.  

    6.7K50发布于 2018-09-13
领券