00:00
大家好,这是我用Python开发的一个快手的采集软件,它主要分为三类功能,第一就是根据关键词采集它的作品和评论,第二是根据主页链接啊,采集这个主页下发布过的所有作品,第三就是一些链接的转换啊,作为一个辅助的工具,我们先看第一个功能,采集评论,首先设置了一些作品的关键词啊,最大页设置为2,然后对评论的内容也进行了一些关键词的筛选啊,采集最大量为5啊,点击通过关键词的采集,然后这个时候软件就进行关键词作品价的采集了,我们从这个日志可以看出采集的进度,第2/5个关键词的第二页,第3/5个关键词的第一页,第二页。第4/5个关键词,好,现在是最后一个关键词,作品采集完之后,他进行了一个自动的去重,然后再采集这些作品下的评论,我同时就进行对评论进行一个筛选。
01:04
我们看这里有一个筛选后数据量2,这就是筛选后的一个评论的数据量,当它采集到5条的时候,这个软件就会自动停止。好,现在提示,呃,CFA已保存,终止采集查看这个CS,对我们来看一下这个最终的结果,首先看作品的数据关键词,这就是我刚才设定的一些关键词,页码,视频标题,标题里的标签,视频的链接,视频的点赞数,观看数,视频时长,视频的发布时间,作者的昵称,作者UID以及作者的主页链接。好,下一面我们看评论的数据,作品ID,作品链接页码,评论者昵称,评论者UID,评论者的主页链接,评论时间啊,评论的点赞数,评论的级别以及最重要的评论内容啊,这个内容是经过我刚才关键词筛选下下的内容。好,我们下一面看看第二个功能,通过作品链接采集,这里我提前填好了三个,呃,作品链接啊,采集评论先选否点击通过作品链接采集。
02:16
好,现在就开始采集这3个作品下的作品详情数据,并且下载无水印视频,现在开始第2个作品,好,现在开始第3个作品。好,已经采集完毕,我们来看一下结果,首先看结果的数据,好,这是三条作品的详情数据,关呃关作,作品ID,作品链接,视频标题话题标签,作者的昵称,作者UID作者主页链接,作品的发布时间,视频时长,点赞数、观看数,评论数啊后面这三个字段暂时为空,下面是封面的链接以及最后一个视频的下载链接。好,我们看下载下来的视频文件啊,这就是三个下载下来的视频文件,到清无水印。好,我们看下一个功能,采集主页作品,我这里准备了三个用户的主页链接啊,点击开始执行,他会依次采集这三个用户的前两条视频,并且下载视频文件。好,他开始采集第一个步骤的视频了。
03:29
开始采集第二个步骤。开始采集第三个步骤,好,软件提示采集完毕,我们来看结果,首先来看博主的作作品数据,作者昵称作者UID作者链接视频的标题,视频的标签,视频的链接,视频的发布时间,视频时长,点赞数、收藏数、观看数好,下面是下载下来的高清无水印视频,好,这是3个,分别是3个博主的啊高清无水印视频好,我们看下一个功能,链接的转换,这里我提前准备了3个主页链接,把它们转为快手号,开始转换。
04:28
好,已经转换完毕,我们来看结果。把三个主页链接转换为了快手号,我们看下一个转换功能啊,快手号转为主页链接,好点击开始转换。采集完毕,好,我们看看这个转换结果,把三个快手号转为了主页链接,并且带有其他字段,包括用户的ID,用户的昵称,用户的个性签名,我们来看最后一个转换功能,APP作品链接转为PC端的作品链接,点击开始转换,好,已经转换完毕,我们来看这个转换3的结果,把APP端的作品链接转为了PC端的作品链接,好,这就是整个软件的一个完整演示,谢谢大家,我们下次见。
我来说两句