00:00
好,那么接下来刚才呢,我们说的是一些基本的,这个是属于一些呃,高级的应用,高级应用第一个。二级分区。二级分区,甚至还可以三级分区、四级分区。也就是说分期字段可以再多一些啊,现在我们能看到分区表的一个东西,是不是在底下建了一个分线项,那二级分区,在这个分区底下再来一个什么文件夹啊,是这个意思,那三级再来一个吧,啊,一般很少到三级了啊,到三个级别这个太太深了,没必要啊二级那在建表的时候其实也一样,就是part by这里面写什么。两个字段而已。写两个字段,那你这块不是可以两个字多个字段吗?那我分区字段也可以多个呀,啊讲到这个事,那我把它来换一个这个表。好,然后我们要往这里呢,去C数据load data叫。
01:01
In,还是这个内容对吧,啊,然后把它拿过。然后这里面呢,有一个de。BT.tst啊,Into。这这个时候你知道了,直接加分号肯定不行啊,啊,这是他的一个分区表了,说我们要加上分区信息啊。而且注意这个地方我们是一个什么。二级分区,所以两个都要干什么?都要写,那第一个假如说是209杠。零七啊零七,然后逗号B等于。零一。走,没没写,表明这个地方叫第小发现。二对吧,它零二走。好加载进去了,那我们正常的去查一下这个表C的C啊,看一下数据能不能查这张表。
02:04
也能查。没问题吧,然后接下来看一下它整个的这上面的一个结构。哎,应该是200。对对,还是一个什么。文件夹对吧,在这个底下才有。文件。才有文件,也就说两层目录啊,二级分区就两层目录而已啊,跟一级用起来是一样的啊,用起来是一样的啊,这个意思好,那同样的我们可以,假如说我只想查一级分区,我可以写这个语句,对吧,没有。Month等于什么?2019杠零七。能查出来吧,那甚至如果说零七底下还有很多no and d等于什么零一对吧?啊,先练了一天的也可以查出来吧,啊,它这个东西呢,虽然我们可以当做普通子态用,更多的还是放在不要子句里边到子句里边包我们过滤数据用的。
03:05
啊,帮我们过滤数据用的这个意思,这是二级分区啊,它呢比较简单,好,接下来我们聊一聊其他的事情。正常的加载数据逗号级分区啊,这个东西你去查一下就OK了,来这个。叫将数据直接上传到分区目录。让分区表和数据产生关联的三种方式。那这个是什么意思呢?是这样的啊,我们刚才是不是有一个这个分区表。刚才我们测了,我们先添加分区信息,然后把数据放在这个。分区目录下是不是能查到对吧,而且当时我们做表的时候是不是也可以,假如说我们创建一张表,然后直接把数据。Put到这个表的目录底下是不是也能长,对吧,现在我要做这个事啊。
04:03
零八那个突出度是不是080910我都用过,我搞一个完全一样的,防止就有同学小残留啊,我11没有用过了,OK,那我做一个什么事呢?来看一下。在这块他都跑。FS杠,Make。招聘。这东西我先给他发掉了,对吧,现在看一下。是不是有一个。接下来我要做什么事呢?哈多。然后第一笔上传到哪。11。然后来看一下11底下数据也有了,那我问一下大家,这个数据我能能不能查到。
05:02
这个能不能到。原数据表里面有就能看到,那你要想这个东西有没有原数据啊,看一下肯定没有啊,我们什么时候去操作过原数据。我是通过什么make d来创建的,他会说在我们买搜里面写一个貌似等于2019杠幺幺这张费吗?来看一下。他可能会有。没有吧,那能查到吗?这不能就不能,所以说我们之前说过,你要想在汉语里面读到数据,两个条件吗?一个是原数据,一个是什么实际的数据啊,就能找到,那没有,现在呢,Month等于。2019杠幺幺肯定是什么查不到数据的,尽管这个数据没用,因为没有元数据啊,所以针对于这种情况呢,我们可以做修复第一个。
06:04
可以执行修复。第二个我可以添加分区形式。就爱把这个2019杠幺幺给他添加一下行不行?可以,因为我们说过你只要有这两个东西我就能访问,不分析后顺序还有印象吗?对吧,无论是你有先有的数据还是先有的原数据,无所谓无所谓顺序,那这个修复命令也可以,这个修复命令我们来看一下啊,这个东西呢,你了解一下就行了。了解一下啊,它挺复杂的,不需要去记啊,不需要去记的这个东西,你知道有这么一个修复命令啊,就是说repair啊,整个的去修复好,现在我们重新查一下。它会校验你HD上的路径,看有没有分区,给他补充一下就做这个事了,修复命令,好,第二个我们来看一下,同样的道理,我再来一个什么。12。对吧,然后这个地方我修。
07:00
我上传这个数据到12。首先我们知道我直接查实啊,肯定查不到了,这不用聊了,因为刚才已经说过了,那我可以怎么做呢?刚才是不是直行的修复命令对吧,你可以不这样做,可以怎么做。奥。Table。然后就。呃,De PT对吧,下划线。好,然后呢,爱的好。括号。貌似等于2019杠。总然后我再来查一下这个地方改成幺二也能查到,因为你在添加分区执行对量命令的时候,它是不是把原数据补充完成了呀,对吧,原数据实际数据两个有了就能看到。啊就能看到,好,继续还有。这个这种呢,就比较简单了,其实你可以不干什么。连这个都不用手动做了,你只要是漏的命令,是不是它的分区信息都会有啊,啊,因为漏的数据我们刚说了,他在对于分区表上做两个事,第一个呢,添加分区信息,也就是说在MY当中添加个语言数据信息吧,第二个就是干什么上传数据。
08:16
啊,上传数据其实用的最多的,如果说数据已存在。然后你要去用的啊,用的最多的,用的最多的。上传后添加分区啊,用的会比较多一点,但是有一种特殊情况会用到它,所以说这个呢,你不要刻意的记,但是你脑子里面知道有这些东西,什么情况呢,这个数据已经存在。好多了,就是说假如说这个数据本来以前呢,我也是一天一天一天存的,已经存了两年了。能懂这意思,也就是说我20192从2018年,假如1月1号开始的,2018年1月1号有个分区,2018年1月2号有个分,2018年1月3号一直到2018年,一直到2019年了,假如说出现了四五百个这个文件夹了,那这个时候我可以去建一个表,直接指向他。
09:09
可以间隔表示指向的,这个时候你就不要用什么了。添加分区了四五百个容易封知道吧,啊,那我们就可以干什么修复一下,哎,修复的时候呢,他把所有缺失的都给你干什么。补充上。啊,都给你补充上,它不光是一回补充一个,他可以都给你补充上啊讲到这个事啊,要注意一下啊,注意一下好,这个呢是在那个正常情况下,如果说你这个表已经建立了,然后你想往里程数据。这个时候你还会去选择说我通过一个命令去创建一个文件夹,然后再把数据铺进去,然后再去做这个事吗?你就不会这样干了吧?哎,这个呢是我们说的,如果说你这个分区表。已经存在了,然后你要往里面放数据的时候,多采用什么漏命令啊,一天一漏吗?分区没有,没有自己创建啊,它会给你创建,就这个意思,也就是说他各自有各自的应用场景。
10:09
啊,这三种呢,都要知道啊,都要知道,而且把握最根本的,我们所讲的它那个地方呢,查不到数据,原因就在于没有原数据信息,对吧?啊如果说你把原数据信息有办法给他找回来了就行了啊,有办法找回来就行了,诶这样我把给它解一下。
我来说两句