00:00
好,我们继续看这个第三个需求,第三个需求,第三个需求呢,他说统计视频观看数在前20。他说所属类别。以及类别包含的前20的视频个数,那这个我们分析一下什么意思。这样看啊,首先呢,这个不用聊了。前20跟第一个把它直接拿过来,把十改成20就够了,第一步对吧?好,那这个20个视频,它是不是有自己的ID,有自己的类别。有自己的类别吧,而且前20这个东西呢,有可能前20名,比如说一到20对吧。第一个人有三个类别,他有两个类别,还有五个类别,七个类别,黑人一个类别是不可能是这样的情况,第二个我们应该干什么事?给他进行。裂炸开吧啊,给它进行炸开,炸开之后我们得到的是不是应该是类似于刚才我们炸裂出来的那种结果,只不过说之前那个炸裂是对于全表进行炸裂,现在对于20条数据进行炸裂了啊,但是效果上是一样的,对吧?啊,就最终结果不一样,效果上是一样的,好炸裂开之后,假如说我我简单一点就是每个人呢,都是五个类别了,因为好算一点是吧,假如说每一个视频都五个类别,就是and and and4次,那接下来炸裂之后应该是。
01:26
100个数据对吧,100个数据,因为每一个我我规定的就是五个,因为这样好说一点,对吧,就是100个,接下来是不是对这100个作为一个完整的数据集来分析,说类别包含top ten视频的个数,那这个代表什么意思?听一首排列表。说该类别包含20的视频的个数。对,某在这TOP20当中,某一个类别总共有多少个视频对吧,而且视频这个时候视频需要跟原来的表进行关联吗?
02:11
不行。想一下需不需要。不需要啊,这100个数据不就是你这20个炸开来的,对吧,我只要对这里边cat进行抗的是不就行了。想一下。想一下这个问题啊,对不对。因为如果说你跟原表进行交易,你还不是要把这个20个第一步所做的事情给他再求出来吗。对吧,啊在90是这意思,也就是说我直接在这个里面去类似于上面操作,按categ积分组求什么。抗的个数就够了吧,啊,看的个数够了,而且我们知道每一个类别最后求出来的效果应该不会超过20。最大是20,而且这是极限情况,也就是说前20排名20的视频都有一个类别,同样的大家都一样,这才会出现一个什么。
03:10
有某一个类别是20的吧,啊正常的都在20下面。比20小吧,也就这意思啊,我们把这个思路分析清楚就够,那第一步不用聊,就是统计什么。十对吧,这个呢,我就不写了,我直接把它给拿过来没问题吧。CRC。拿过来,然后这个改成20,但是还要改一个东西。是不是至少要加一个类别啊,因为你接下来对类别进行炸裂,你现在没有类别怎么炸裂。没问题吧,啊,要加一个类别,其实只要一个类别就够了。其实只要一个类别的够了,对不对啊,因为后面只对类别进行操作,跟原原来的这个什么VI ID views啊,这个都没有,都没有任何关系吧,啊这个呢,我我运行一把吧,啊运行一把。
04:05
走,这是第一步啊,第一步我们接着写,第二步接下来干什么事?第一秒对吧,好,第二个对。第一表。T1。表中的谁category这一列进行。进行炸裂对吧?啊进行炸裂啊,那我们写一下单独的对它进行一个炸裂啊,取出来所有的一个类别,那这个炸裂怎么写select。假如说这个VIVO ID我还保留着吧,啊,其实这个时候早都可以不要了,对吧,我们只要一个开这边就行了啊呃。那就留着,然后还是同样的cat name吧,啊,还是叫cat name,然后这个时候呢,是from这个T这张表,好,然后letter view对吧,View,然后是我们所说的exp。
05:02
Category这一类啊,进行一个炸裂,然后呢,还叫下划线category对吧,As category。Name对吧,啊,还是取那个别名,还取那个别名好好它。A步,这是20,这也没有多少。Company,只有这,这是一个什么?两个就就只有只有两条数据是两种,两种不同的类型是吧?啊两种不同类型,好,然后我们把第二个搜狗来跑一下吧,啊第二个搜来跑一下,然后呢,我们在这写一个临时的啊。因为我们跑完之后删掉,我不想放在这个思路中间,然后在T前面加一个括号,对吧,把这个。拿过来往那一站。走一下。啊,跑一下这个内容走。这个东西呢,我们就不要了啊,只是做一个临时的这个表,是一个TR表吧,啊是一个TR表,好,那接下来第三步。
06:01
求类别包含TOP20视频的一个个数。那接着按Q2表进行什么分组进行求抗的对吧,那对T2。表进行分组求和啊,分组后面呢。我们加一个括号,哎,谁分组category name对吧?啊,分组求和,这个和呢是什么?叫总数对吧,啊总数,接下来我们写一下这个就简单了吧,Select。Cutdy in them。看了。心对吧,啊,看到心。康新,我们最后假如说我也给他排个名吧,好吧,排个名的话,我们是不是最好取个别名啊,叫cat count可以吧啊count,其实他没说排名吧啊,你不加这个排名,奥特曼也可以啊,不加也可以好,然后from。
07:01
T2表。快。BY这个category name对吧,还有name,然后order by这个。Category count,然后DEC对吧,还是倒序排一下啊倒排一下。这个没有说求前十啊,什么东西的啊,那就直接亮了,也不用limit米的,是不是不用limit米了,好我们看一下第二次结果,第二结果呢,是给它炸裂开的吧,啊其实应该比刚才只多了两条数据。没问题吧,因为第一次我们只有两条里面有两个嘛,所以应该多的是两条数据22条,22条啊,那接下来最终的搜狗我们来封装一下,对吧,叫。最终。思考思考。把这一粘T2前面加一个英文的括号。行,给他拿过来。到这。好,T1再加个括号吧,把这个T1给他拿过来。
08:06
哎,写一下,其实这里边有的子查询的括号是可以不要的,是可以不要的,但是呢,尽量的你其实写的括号方便自己查看的,因为一个括号到右括号代表一个形,这样方便查看的。走。这样我们就能拿到那个排名前20观看数前20所属类别,以及每个类别包含的淘宝,淘宝20的一个视频的一个个数啊,是这个意思啊,假如说是这样的,这个类别包含的。前50视频的个数。那你只能去关联了吧。对吧,啊,你必须要去关联,它是这个意思哈。啊,什么意思不是。如果说我要统计视频观看数在前20所属类别,以及类别包含观看数在前50的视频的个数。
09:02
能听懂吧,对吧,那这个时候你不能说直接看的心这种方式做吧,啊,因为这两个正好都是前20。同一个数据集对不对,如果说你这个是前50,你是不是要再把前50给他拿出来,拿出来之后还不行,还要对着前50的数据给他干什么。炸开,然后再做类别的教育,对不对?因为你不炸开怎么做交易码。一个是一个是数组能教育吗?交不了吧,是不是对这个50也要炸开啊,对吧,那我们看一下最终的一个结果,哎,就是这几个,哎,那天的娱乐还是最多吧,永远看人还是娱乐是吧。最终操作我同样的把这个结果呢,也粘在这啊,到时候呢,咱们可以自己做一个对比啊,做一个对比啊。他。
我来说两句