00:00
好,那之前呢,我们是了解了它整个的一个基本概念,从它是什么东西对吧,到它的一个架构,到它跟MYSO就是关系数据库的一个比较,这块呢,做了一个整体的了解啊这了解,那接下来呢,呃,我们得用一下啊,就光了解不够对吧?啊用一下之前我们说了它是由那个Facebook公司开发的,但是交给发奇了,所以他这个官网地址这个内容,那我们稍微看一下官网啊,之前哈多的一个图标大家还记得。这个大象对吧,来看一下have呢,它是基于哈本来的,而且做哈的一个数据分析的,来看一下图标上面有什么关系,投子他是一个蜜蜂。对吧,这是个蜜蜂,但是蜜蜂的头是什么大小?这蚊子,那你要说蚊子我也忍了好吧,那你要是拿着大象笔在抽血,那就是啊,呃,这个蜜蜂啊,其实咱们都知道蜜蜂是干什么事情采花的是吧?你们就喜欢采花采花是吗?不喜欢啊,好,这更重要,亮密码就是把我们。
01:14
原始的一个什么东西,把它进行一个加工,对吧?啊,其实跟我们所说的数据分析的一个过程很像。啊,但是他他这个整个的完成的过程比较慢,就是因为他拖了一个大事谱。那你觉得一个蜜蜂挂了一个大象头,还能飞得快吗?对吧?啊,所以呢,它整个运行比较慢,这是我个人理解啊,啊这是个人理解,我觉得它有这种含义啊,就是每一个框架的一个图标啊,都有都有这种含义啊,都有这种含义,OK,那这是它这个图标官网地址,你到时候自己看一下,还有文档查的地址,下载地址,因为按照我们的下载的东西呢,都给你下载好了。下载好了,OK,那我们看一下部署这块在哪啊资料。加吧。加,那这个当中呢,注意我们要考这两个东西。
02:08
就目前公司当中应用场景来说,还是以一版本为主,但是我们了解到我们跟很多那个大公司,在大公司的学生都去沟通,因为我们现在不在一线做开发了,所以来源于一线的一个消息只能来源于企业老师啊,我们有企业老师去沟通,然后或者说是呃,你们毕业了把你们找回来对吧,请你们吃一顿,就桌上咱们聊一聊啊,用到什么技术了啊,咱们教的技术够不够,或者用到什么新技术,或者框架有没有升级等等这些东西啊,来源于这个我们了解到呢,就是目前来说有一些公司在向这个二版本去发展,而且二版本去发展的情况下,我问了几家啊,呃,2.3的居多。所以呢,这个版本放在这儿啊,未来有有可能呃,两三期之后我们就上2.3,也有可能啊,也有可能,因为随着这个企业发展嘛,我们就是面向企业去培训的啊,所以呢,随着发展,但是现在还是以一为主流,这次呢,我们还是以一来授课的啊,来授课的啊,那所以你要考核价包呢,就是1.21和这个麦狗。
03:11
啊,在LI6色当中,我们要装一个斯克。因为我们前说过,它不有个原数据嘛,对吧,默认存量多利,但是有问题,我们要改造MY,所以呢,这两个东西我们要去装下,至于这里边还有说,呃,这是snap压缩的一个哈,到时候我们还再聊,我们在这个have当中啊,会用一下这个snap。之前你们用过没用过对吧,那这个当中我们要用一下,其实他用起来跟你没用没什么感觉,但是作为你们吧,不再是你们用你你你们就感觉就根本就讲讲的就跟没讲一样。能懂这意思,而且确实如果说不带你用,呃,假如说面试官问起来,他说你用这个时候有没有出现什么问题啊,怎么用的呀,你一下就慌了是吧?啊,其实用一下你就感受一下就OK了啊,其实很简单,这个东西好好,然后呢,我们先把这两个东西搞进来啊。
04:04
嗯。RDB点道,我先把它开启,开启的CDBD,然后呢,把我们这两个夹波给它拖进来。传输工具你们随便用什么无所谓啊,但是C发递它自带一个,你可以用快捷键al加PIN,直接往里扔就行了啊,你先进到哪个目录,它就扔到哪个目录,默认的是扔在加目录,如果说你不改目录的话,再加目录。好把这个起一下,因为等会我们还要去用呃让起,然后呢,我们去解压一下O好这不压缩对吧,然后那个到。好,正好呢,在这里边我们也把它解答一下吧。Z宝宝怎么这样?对吧,因为大家用的比较多的就是啊,不要忘了,然后那个。
05:03
如果说我想把这个这包解往其他目录呢。告不是搞地。而且小弟。啊,到地稍微注意一下,这个呢,我们就放在这就行了,因为它里边是RPM包。啊,所以放在这,放在这之后呢,我把这个删掉,My circle这个就不报啊,这个就不用了啊,不用了,到时候我们装备circle在这,我就一次一解压了啊一个行了,OKCD到model里边。呃,然后改个名字啊,阿巴奇就叫。啊,这是汉CD到汉尾的。而常规的一些目录。常规的第一个目录。就是一些命令吧,啊,假如说他要什么启动什么东西的话,是不是都在这里边啊,啊可执行文件,因为我们并没有看到它有一个STEM。有的框架是不是B目录跟目录啊,那目录就是启动进程的,B目录就是操作这些的内容的,对吧?啊两个分开的,但是更多的我们看到框架都只有一个什么。
06:09
并没有,也就是启动啊和操作啊都在一块,都在一块那还不一样,这个配置文件啊,那我们要改的啊,就在这里边还有。詹姆斯。案例对吧,啊案例那这个不用管看。不是啊,这cat头lo这个东西呢,它其实也是阿一个方向,它是来抓数据的。啊,它里边要获取原数据啊等等这些东西会运到这个方向啊,用到这个方向啊,这个呢,不是我们关心的个点啊,不是我们关心的点,OK,那就不用聊了吧。对吧,啊,另外呢,就是所依赖的一些下包,其他的notice体的密啊等等这K这一堆啊,其他的一些东西就是常规的一些啊,常规些不OK,那我们要改的是一个抗,我们继续看一下。那你觉得要改什么东西,就是你之前学的哈杜那些吗?
07:04
模板的去掉。因为default,因为因为。那defat这个东西是不是类似于我们在hard里边那个什么set文件啊,对吧,它有个默认值,然后我们要给它来一个set对吧?啊进行改造很多默认值,因为呢可以环境变量的对吧?啊可环境变量的也就是重要的就改这两个东西,而且现在呢,我们还改不到上。啊,现在我们主要改的是往下看。配置哪个地方。因为你要告诉我你用的哈多是哪一套。我们不是说了你have要依赖于哈吗?对吧?你得告诉我哈是谁?啊,你用哪个好多网,因为在生产环境当中,你有很多好多集群啊,你有很多好多集群,这个意思好,然后呢,我们主要把它来配一下,配下之后呢,可以去启动了啊,就可以去启动网啊主要现在这个内容,但是呢,它还有一定的问题在里边了,呃,那我们来。
08:14
还是在这儿去配一下吧,你看。然后还有康,我们先直接对这个模板进行修改,修改完了之后呢,再去做操作这块哈,过后。然后我直接就这样,直接在后面添加也可以吧,不改了,因为他是注释掉的,对吧,在后面添加也是一样的。啊,也是一样的,Have come have have的一个come blue,注意你要摘我的话,你这个我改了名字了啊,你不要直接摘,OK吧,保存一下啊下。现在呢,我们整个的汉呢,就已经。就改一下哈,多本的一个环境变量就行了。而且呢,如果你配了整个的哈的一个。
09:00
环境变量在ETC里面配的,其实也可以不改,也就是说have直接解压之后就可以启动啊,就可以启动OK来并怎么起呢?并下有个have,这个是进到客户端的。直接通过命令就可以进到客户端,那我们进一下。大家做他这个初始化,初始化之后呢,我们看这个地方会多一些东西,整个的钢铁目录。多了两个东西,一个叫德比对吧,一个叫DB。叫原数据存储的一个数据库,还有一个德比。啊,这是我们之前所讲的,它默认的原数据存在德比当中的。对吧,啊,这个先不用管,就先放着他用德比就用德比好,这个呢,进到have里边来了。
10:02
这是汉一个箭头对吧,在这里面呢,你就可以写一些。海口。那它这个语法呢,绝大部分跟我们一样,跟我们一样,那我正常的是要创建一张表啊,创建一张表,那我们先show database,看有没有默认的。水浒。有一个at对吧,其实你一进来就在at,那你要不放心,我们可以干什么,又一下可以吧,啊又一下。也可以,好,那接下来我们去创建一张表,之前的MY当中怎么写,这题怎么写。可以的table,然后是表明假如说student对吧,Student然后。然后呢,随便字段对吧,字段,那这里面字段跟不一样啊,是什么差呀,等等类型啊,它那个类型呢,就是之前张号当中类型一样啊,那这个地方我们来一个I。
11:00
再来一个妹对吧。小写大写都行。啊,相信大家都行,好保存。啊,直接上会车创表,那我们看一下有没有创成功吧,Show tables这个也一样啊,什么说那个database收tables一样student对吧?现在我们正常的可以去查询select新from这个student表,那肯定是一个什么空表吧,啊,这个没问题,肯定是一个空表,那我们往里面插数据,按照我们之前的语法插入音色的。Insert into。然后呢,Student,然后是不是value括号。一个一,然后这个传对吧,传那个张三吗,班长。你看他在干什么事儿,他在干什么事儿。
12:06
808都来了。这这什么吧,而且告诉你数据是一个什么。没有没有维操作,它不需要聚合吧,啊简单成为数据,所以这个呢,它是基于。MR呢,能看出来吧。好,那还有一个其。DFS吗?对吧,那我们俩访问一下,还是给。5070对吧,点开。同样的一个跟这里面一个,看一个优子。啊,这两个呢,都是自己创建的,因为我那个哈多是新装的,什么东西都没有啊,什么东西都没有,它的数据在哪,在这又在底下遗憾。
13:01
那你看到还肯定还有房间的,点开这有一个。点开这什么表明。这就表明吧,点。你们之前遇到过什么怕的零,零怕零。刚才走了一个二走了一个,结果就是什么这个,那我们俩刚才我们看到那班长他少个半是吧,那谁来陪班长。副班长,你们副班长,副班长来陪。铁柱啊。那这副班长没有,那就班长YY一个好吧。我们来走一下,你看这个就执行是比较比较高吧,你要卖三个早都完了,20秒是20秒来刷新。
14:02
看着是考虑注意这个不一样啊。只不过说它命名两个完全一样的,它不能用两个完全一样的名字吧,你再往里插就考二,再往里插考三啊,它是这样命名的啊,命名的是这种方式,好,那我们常数这句呢,我们能不能查到呢。对吧,She from。班长的副班长都出来了吧?诶,那有同学在想查询怎么这么快啊,这个也是我们后面优化的一个点,因为我们它默认开启的这个优化类似于select新这种方式,他不走了吗?但是我select。那你大家觉得什么东西会走吗?字段是什么?那我们试一下好吧,字段。你不走肯定要做计算嘛,我抗的心行不行,我求多少条数据,多少个人对吧?C看的心。
15:00
From这个student。提交任务了吧,啊,因为他做计算,刚才是不是简单的去抓取数据啊,对吧?啊简单的抓取数据他不走啊,不走ma啊,因为做了优化,当然你可以把那个关掉,你写C心他做了吗。他都会走M吧,那这个就太麻烦了吧,对吧,所以呢,他默认就是呃,开启的那个优化是开启的,后面我们会看那个优化的属性,OK,两个人没问题吧,啊两个人啊,这基最基本的一个操作啊,这个操作呢,这也都有。啊,并看完具写多时啊,就具体的一个内容,你去查数据查询对吧,查询这种方式好,这个呢,我们把它截一下。
我来说两句