搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏ReganYue's Blog
【PTA】7-10 方阵转置 (15分)
输入格式: 输入第一行给出一个正整数n（1≤n≤6）。随后n行，每行给出n个整数，其间以空格分隔。
1.1K30发布于 2021-09-16
来自专栏刷题笔记
7-10 阿生的粉丝团 (30 分)
本文链接：https://blog.csdn.net/shiliang97/article/details/101473111 7-10 阿生的粉丝团 (30 分) 夭折了，阿生竟然有粉丝团了，而且还是清一色的妹子
31420发布于 2019-11-08
来自专栏python3
Python导出Excel文件
根据之前导出到txt文件的贴吧爬虫内容示例： title:片花《战狼2》要的dian firstAuthor:可爱的... reNum:6 content:关注弓重 hao→ ziyuanhuoqu 31 title:《街机假日捕漁》手游版全屏×××实力首选 firstAuthor:嘎钒勘颂 reNum:4 content:RT lastAuthor:冠敌讯延 lastTime:7- lastTime:7-10 title:抽取7月23日《战狼2》电影首映会嘉宾名额2名！ 10 title:求战狼 firstAuthor:月少T reNum:1 content:求战狼 lastAuthor:20323芮 lastTime:7-10 。。。。。。。将这样的爬虫内容存放到Excel里面 # -*- coding:utf-8 -*- import xlwt book=xlwt.Workbook(encoding='utf8',style_compression
1.8K20发布于 2020-01-09
来自专栏刷题笔记
【未完成】7-10 关于堆的判断 (25 分)
本文链接：https://blog.csdn.net/shiliang97/article/details/98790049 7-10 关于堆的判断 (25 分) 将一系列给定数字顺序插入一个初始为空的小顶堆
60710发布于 2019-11-08
来自专栏全栈程序员必看
7-10 公路村村通(并查集kruskal)
现有村落间道路的统计数据表中，列出了有可能建设成标准公路的若干条道路的成本，求使每个村落都有公路连通所需要的最低成本。
49010编辑于 2022-09-21
来自专栏刷题笔记
7-10 功夫传人 (25分) 图深度优先搜索
7-10 功夫传人 (25分) 一门武功能否传承久远并被发扬光大，是要看缘分的。
58420发布于 2021-02-02
来自专栏以终为始
7-10 公路村村通（30 分）【最小生成树模板】
7-10 公路村村通（30 分）现有村落间道路的统计数据表中，列出了有可能建设成标准公路的若干条道路的成本，求使每个村落都有公路连通所需要的最低成本。
22630编辑于 2023-03-09
来自专栏刷题笔记
【2020HBU天梯赛训练】7-10 倒数第N个字符串
7-10 倒数第N个字符串给定一个完全由小写英文字母组成的字符串等差递增序列，该序列中的每个字符串的长度固定为 L，从 L 个 a 开始，以 1 为步长递增。
57331发布于 2020-06-23
来自专栏刷题笔记
【未完成】7-10 至多删三个字符 (35 分)
本文链接：https://blog.csdn.net/shiliang97/article/details/102727562 7-10 至多删三个字符 (35 分) 给定一个全部由小写英文字母组成的字符串
57810发布于 2019-11-07
来自专栏python学习教程
python爬虫学习：爬虫与反爬虫
二．爬虫分类网络爬虫按照实现的技术和结构一般分为通用网络爬虫、聚焦网络爬虫。从特性上也有增量式网络爬虫和深层网络爬虫等类别，在实际的网络爬虫中，通常是这几类爬虫的组合体。通用网络爬虫通用网络爬虫（General Purpose Web Crawler）。通用网络爬虫又叫作全网爬虫，顾名思义，通用网络爬虫爬取的目标资源在全互联网中。聚焦网络爬虫聚焦网络爬虫（Focused Crawler）也叫主题网络爬虫，顾名思义，聚焦网络爬虫是按照预先定义好的主题有选择地进行网页爬取的一种爬虫，聚焦网络爬虫不像通用网络爬虫一样将目标资源定位在全互联网中一般反爬虫策略多数用在比较低级的爬虫上，这类爬虫多为简单粗暴的不顾服务器压力不停访问，再一种为失控的或被人遗忘的爬虫，这类爬虫一般需要在第一时间封锁掉。越是高级的爬虫，越难被封锁，相应高级爬虫的开发成本也越高。在对高级爬虫进行封锁时，如果成本高到一定程度，并且爬虫不会给自己带来大的性能压力和数据威胁时，这时就无需继续提升成本和爬虫对抗了。
4.9K62发布于 2019-07-10
来自专栏IT技术圈（CSDN）
浙大版《C语言程序设计（第3版）》题目集练习7-10 查找指定字符
练习7-10 查找指定字符本题要求编写程序，从给定字符串中查找某指定的字符。输入格式：输入的第一行是一个待查找的字符。第二行是一个以回车结束的非空字符串（不超过80个字符）。
2.5K30发布于 2020-09-15
来自专栏短信接收服务
爬虫系列：爬虫介绍
而数据采集采集就需要使用到网络爬虫（Web crawler），网络爬虫也会被称为：网络铲（Web scraper，可类比于考古用的洛阳铲）、网络蜘蛛（Web spider），其行为一般是先“爬”到对应的网页上网络搜索引擎和其他一些网站使用网络爬虫或蜘蛛软件来更新他们的网络内容或其他网站的网络内容索引。网络爬虫复制页面以供搜索引擎处理，搜索引擎对下载的页面进行索引，以便用户可以更有效地搜索。对于一些涉及查看当下热门话题的爬虫项目，还需要使用自然语言处理。在网络爬虫抓取数据的时候，目标网站可能设置了验证码、网络爬虫陷阱，同时相同的 User-Agent 也会被视为非正常用户，这些都需要避开。以上都是网络爬虫需要的技能，我会在接下来的章节中，详细介绍爬虫的每一个技术，使大家学会使用网络爬虫获取自己需要的数据。
1.4K12发布于 2021-10-12
来自专栏程序员的知识天地
python爬虫入门：什么是爬虫，怎么玩爬虫？
看到这两只爬虫没有？两只爬虫两只爬虫跑得快跑得快一只没有.. 不好意思跑题了... 别误会，今天不是要教你怎么玩上面这两只沙雕玩意。我们刚刚提到的一个自动化的程序就是爬虫知道了什么是爬虫之后问题来了爬虫怎么玩的？爬虫可以用到一些 Http 库向指定的服务器偷偷摸摸的发起请求，这个时候爬虫可以假装自己是浏览器（添加一些header信息）大多数的服务器呢，傻不拉的以为是浏览器发送请求就直接返回数据给爬虫了当然了，有一些网站比较精明所以他们会建立一些反爬虫机制但是，对于我们来说，不在话下这个是后话了！以上就是我们的爬虫的具体爬取流程，这是我们开启爬虫体系的第一篇，接下来我们将一步一
1.1K20发布于 2019-05-31
来自专栏编程
小白爬虫之爬虫快跑
今天就教大家来做一个多进程的爬虫（其实吧、可以用来做一个超简化版的分布式爬虫）其实吧！还有一种加速的方法叫做“异步”！不过这玩意儿我没怎么整明白就不出来误人子弟了！（因为爬虫大部分时间都是在等待response中！‘异步’则能让程序在等待response的时间去做的其他事情。）一个多进程多线的爬虫就完成了，（其实你可以设置一下MongoDB，然后调整一下连接配置，在多台机器上跑哦！！嗯，就是超级简化版的分布式爬虫了，虽然很是简陋。）结束语转载请注明：静觅»小白爬虫第四弹之爬虫快跑（多进程+多线程）
1.5K80发布于 2018-01-29
来自专栏用户8057608的专栏
Python爬虫系列：浅谈爬虫
Python系列写完后，想趁热打铁将爬虫系列也写了，这样大家以后也可以爬爬图片，音乐，视频啥的也方便，小**的视频也可哦，嘻嘻。 Python爬虫，顾名思义是爬取信息的。学习爬虫，首先得先培养爬虫的思想，比如网络上的文本，图片，视频等等，其实都是由“某个东西”保存起来的，然后通过网络返回给用户。 URL是通用的资源定位符，URI同样也是资源定位符，由于URL包括URI，且URL适用范围广，所以URL就占了上风，爬虫是要有爬取的信息目标的，而目标就是URL包含的文件信息，这样就不难理解为什么爬虫一定要有确切的网址才能爬取到该文件了那么爬虫简单来说就是某个虫子顺着这个路线找到我们想要的东西，然后将其解析，提取出来。（Python爬虫系列）未完待续...
1.9K30发布于 2021-01-25
来自专栏海仔技术驿站
Python爬虫之爬虫概述
爬虫概述知识点：了解爬虫的概念了解爬虫的作用了解爬虫的分类掌握爬虫的流程 ---- 1. 原则上,只要是客户端(浏览器)能做的事情，爬虫都能够做爬虫也只能获取客户端(浏览器)所展示出来的数据 ---- 知识点：了解爬虫的概念 ---- 2. 爬虫的作用爬虫在互联网世界中有很多的作用，比如：数据采集抓取微博评论(机器学习舆情监控) 抓取招聘网站的招聘信息(数据分析、挖掘) 新浪滚动新闻百度新闻网站软件测试爬虫之自动化测试爬虫的分类 3.1 根据被爬取网站的数量不同，可以分为：通用爬虫，如搜索引擎聚焦爬虫，如12306抢票，或专门抓取某一个（某一类）网站数据 3.2 根据是否以获取数据为目的，可以分为：功能性爬虫 ---- 知识点：了解爬虫的分类 ---- 4. 爬虫的流程爬虫的基本流程如图所示 ?
2.8K10发布于 2020-09-08
来自专栏入门到放弃之路
自学爬虫 1 - What is 爬虫？
前言记得17年实习，刚听到爬虫这个词的时候，感觉特别遥远。那时还特地从网上下载了一本，在公司看了三天左右，用Java写下了人生的第一个爬虫PoiCrawler，记忆尤为深刻。对于爬虫，我的定义就是：在Java中爬虫是Jsoup，在python中就是requests(urlib)库(Scrapy先不提)。所以，在这里给爬虫粗略定义：爬虫 = 爬取网页 + 解析目标数据 + 数据存储爬取网页所谓的爬取网页，就是通过请求，将展示在浏览器的网页获取到。结语其实常见的爬虫简单的一，没有想象的那么复杂。入门的话用好requests和bs4就足够了。随着接触的爬虫越来越多，知识面越来越广泛，技术能力层面也会随之提升。在以后的开发过程中，遇到的反爬虫技术也会让你快速成长。
97720编辑于 2022-05-09
来自专栏程序员小王
【Python爬虫】初识爬虫（1）
写在前面之前写了两篇关于爬虫的文章微信好友大揭秘，赵雷到底在唱什么，纯粹是自己的兴趣引导自己学习爬虫，关注里应该有好多对爬虫感兴趣的小伙伴，为了巩固自己的爬虫知识，从今天开始更新python爬虫这个基础教程，自己准备了挺长时间整理了自己的学习笔记，希望能给初学者带来一点帮助，在这个教程里我会给大家介绍爬虫常用的库跟大家做几个有意思的Demo。这篇文章主要是让大家了解爬虫和爬虫需要的基础知识，话不多说，我们开始吧。什么是爬虫？在我们爬虫过程中url，响应内容，提取的数据都是字符串，因此我们需要去了解字符串的相关知识。总结 1、爬虫流程：请求--->获取响应--->解析--->存储 2、爬虫所需工具：请求库：requests,selenium（可以驱动浏览器解析渲染CSS和JS，但有性能劣势（有用没用的网页都会加载
2.1K20发布于 2019-07-02
来自专栏sktj
python 爬虫与反爬虫
解决方法：此种方法极其容易误伤其他正常用户，因为某一片区域的其他用户可能有着相同的IP，导致服务器少了许多正常用户的访问，　　　　　　所以一般运维人员不会通过此种方法来限制爬虫。不过面对许多大量的访问，服务器还是会偶尔把该IP放入黑名单，过一段时间再将其放出来，但我们可以通过分布式爬虫以及购买代理IP也能很好的解决，只不过爬虫的成本提高了。 USERAGENT：很多的爬虫请求头就是默认的一些很明显的爬虫头python-requests/2.18.4，诸如此类，当运维人员发现携带有这类headers数据包，直接拒绝访问，返回403错误解决方法：直接r=requests.get(url,headers={'User-Agent':'Baiduspider'})把爬虫请求headers伪装成百度爬虫或者其他浏览器头就行了。　　　　 8、转换成图片最恶心最恶心的反爬虫，把页面全部转换成图片，你抓取到的内容全部隐藏在图片里。想提取内容，休想。解决办法：图像识别吧，但是感觉代价很大。。。
3.2K42发布于 2019-10-21
来自专栏毛利学Python
爬虫篇|爬虫实战（十）
前言：对于爬虫还有一点小知识 fake_useragent的使用 fake_useragent第三方库，来实现随机请求头的设置；安装 ---> pip3 install 爬虫练习目标：爬取毛豆新车的数据，开线程使用队列大量的爬取 https://www.maodou.com/car/list/all/ （链接） ? 要点进去继续爬取，这是爬虫最常见的方式，也是必须会的爬虫，对于这种方法，一般用框架使用的多 ? 总结：对于此类爬虫，一般使用的都是scrapy和pyspider框架，但我觉得能不能使用框架最好不使用框架
1.1K51发布于 2019-08-29

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

【PTA】7-10 方阵转置 (15分)

7-10 阿生的粉丝团 (30 分)

Python导出Excel文件

【未完成】7-10 关于堆的判断 (25 分)

7-10 公路村村通(并查集kruskal)

7-10 功夫传人 (25分) 图深度优先搜索

7-10 公路村村通（30 分）【最小生成树模板】

【2020HBU天梯赛训练】7-10 倒数第N个字符串

【未完成】7-10 至多删三个字符 (35 分)

python爬虫学习：爬虫与反爬虫

浙大版《C语言程序设计（第3版）》题目集练习7-10 查找指定字符

爬虫系列：爬虫介绍

python爬虫入门：什么是爬虫，怎么玩爬虫？

小白爬虫之爬虫快跑

Python爬虫系列：浅谈爬虫

Python爬虫之爬虫概述

自学爬虫 1 - What is 爬虫？

【Python爬虫】初识爬虫（1）

python 爬虫与反爬虫

爬虫篇|爬虫实战（十）

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

【PTA】7-10 方阵转置 (15分)

7-10 阿生的粉丝团 (30 分)

Python导出Excel文件

【未完成】7-10 关于堆的判断 (25 分)

7-10 公路村村通(并查集kruskal)

7-10 功夫传人 (25分) 图 深度优先搜索

7-10 公路村村通 （30 分）【最小生成树 模板】

【2020HBU天梯赛训练】7-10 倒数第N个字符串

【未完成】7-10 至多删三个字符 (35 分)

python爬虫学习：爬虫与反爬虫

浙大版《C语言程序设计（第3版）》题目集 练习7-10 查找指定字符

爬虫系列：爬虫介绍

python爬虫入门：什么是爬虫，怎么玩爬虫？

小白爬虫之爬虫快跑

Python爬虫系列：浅谈爬虫

Python爬虫之爬虫概述

自学爬虫 1 - What is 爬虫？

【Python爬虫】初识爬虫（1）

python 爬虫与反爬虫

爬虫篇|爬虫实战（十）

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

7-10 功夫传人 (25分) 图深度优先搜索

7-10 公路村村通（30 分）【最小生成树模板】

浙大版《C语言程序设计（第3版）》题目集练习7-10 查找指定字符