温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
呃,刚才写完了忘了改一个东西,这个地方不能写过的了吧,对吧,那放了集合,应该把集合干什么写出去,对吧?啊,应该把集合写出是这个意思啊,所以呢,我在录屏里面就改一下啊,大家注意一下,这个地方呢,最后写的没改啊,没改好,然后呢,我们把这个东西干什么,打个包扔到集群上去并行嘛,啊扔到集群上去来。然后这个拍给你啊,我还是先一下听一下。呃,然后呢,重新打个包。它就在里边,我们把它拿过来。哎,我不要还是不要直接拖,因为那里边有一些这个名字,所以呢,我还是改个名字啊,因为都用了这个叫这个名字呢叫。UDTF是吧,啊要UDTF点下。区区别一个名字。给它加起来,然后同样的应该艾价对吧,加把这个路径呢,给它复制一下在这个地方。
01:12
好,然后。叫风什么?呃,这个叫UDTF可以吧,啊叫udf叫udf嘛,防止跟那个什么系统的有什么,假如说有什么东西冲突,对吧,UD。诶。有天好,呃,接下来写什么东西?As前列名对吧,As前列这个创建的跟那个都一样。穿着罐都一样。走,然后我们来使用一下,我们没有那个列什么逗号的,那我们自己直接传一个就OK了,这样呃,Select的,然后叫MYDTF括号两个参数对吧,第一第二个参数呢,我们先写一下,假如说我数据啊,逗号分标的前面呢,我们是hello。
02:05
逗号。Word,然后艾啊,假如说硅谷对吧,啊硅谷,然后这个内容啊,然后因为你自定义函数,我们正好来一张表啊,还是哈哈这张表,你得给他一个表,然后limit什么。嗯。对于每一行数据,我想想看啊,有没有那种因为自定义,因为它这个是自定义的函数啊,我们之前是不是错过很多函数,直接select这个内容,不用from可以啊啊自还是我们来看一下,也可以来这个地方。你看一下这个东西这个货的。是,嗯,我们里面没有word吧,是word,这个word哪来的呀。我们取的列名吧,啊,就这个东西就类似的,你写宋,他是不是也给一个自己的默认名字啊,但是这个东西可以被我们什么起别盖我起个别名啊,我叫我是可以了啊走。
03:03
那你看。对吧,就是我们看到初始化这个地方做了什么事,然后我们看一下它这个呢,确实帮我把这个数据给它占上了。分成了四行吧,啊分成四行,而且这个逗号是不是我们自己定义来,也就是说我可以这样。我用杠,我中间用什么。爱硅谷,我这个呢,我三个单词了,Hello word爱硅谷对吧,那走诶,Hello word硅谷给他分开吧,是这个意思啊,那这样子能达到我们那个需求了啊,需求是这意思啊好,接下来还有一个问题,就是我们之前所聊到的这个东西啊。这是一个list,我们来写一个什么呢?多个的啊,多个的,我把这个截一下。
我来说两句